Поиск объявления по номеру авито: Как найти объявление по номеру на Авито

Поиск объявления по карте Авито

QQROOZA
ЕКАТЕРИНА ОСИНОВСКАЯ

Содержание

  • Введение
  • Как пользоваться картой на площадке Авито
  • Другие статьи
  • Кто вы вообще такие?

Введение

Меня зовут Екатерина Осиновская, я руководитель отдела клиентского сервиса компании QQROOZA.

Представляю вам свой цикл статей, который поможет вам детально разобраться с интерфейсом площадки Авито.

Эта статья расскажет вам как искать объявления по карте Авито.
Приятного чтения!

Как пользоваться картой на площадке Авито

Искать объявления по карте очень удобно. Так вы можете найти работу, квартиру или найти нужные услуги в определенном районе. Только объявления в категориях «услуги», «вакансии» и «недвижимость» можно смотреть на карте.

Для поиска по карте введите нужные вам параметры: тип категории; название объявления, по которому будет совершен поиск; город или регион. Также вы можете указать метро или район. После того как вы ввели нужные вам параметры, нажмите на кнопку «Найти».

Чуть ниже поиска появится карта. Нажмите на «Показать объявления на карте».

На новой карте появятся все объявления. Вы можете выбрать нужный вам район, приблизив карту колесиком мышки или же нажать на плюсик с правой стороны. Также вы можете перемещаться по карте, зажав левую кнопку мыши и двигая стрелкой мыши в нужном для вас направлении.

Для выбора нужного объявления нажмите на него. Его значок на карте станет красным, а с левой стороны появится краткое описание объявления: название объявления; фото; цена; месторасположение.

Чтобы ознакомиться с объявлением подробнее, нажмите на название объявления. Вам откроется новая страница, на которой вы сможете прочитать полную информацию.

Остальные статьи из цикла об интерфейсе площадки:

Цикл статей о продвижении на Авито:

Несколько наших кейсов:

Агентство QQROOZA

Агентство QQROOZA – эффективная команда молодых и креативных профессионалов, которая обеспечит вам комфортное взаимодействие и высокий, а главное полностью прозрачный результат от вложенного вами рекламного бюджета. Наша задача — сделать так, чтобы каждый вложенный вами рубль приносил вам прибыль.

В наши услуги входит:

· Проведение аудита и конкурентного анализа вашего бизнеса на Авито
· Создание и правильное оформление магазина на Авито
· Составление продающих текстов
· Создание качественных уникальных объявлений
· Подбор и редактирование фотографий для объявлений
· Своевременный ежедневный постинг ваших объявлений
· Корректировка рейтинга вашего магазина
· Переговоры и решение конфликтных ситуаций с поддержкой площадки
· Гарантия на случай блокировки
· Помощь в интеграции Авито с вашей CRM системой
· Еженедельный отчет по 22 показателям вашей рекламной кампании
· Ежедневный краткий отчет за прошедший день продвижения

Оставьте заявку прямо сейчас

и получите бесплатный аудит и конкурентный анализ вашей ниши на Авито

Telegram-боты для пробива и поиска информации

Содержание

  • 1 Как работают Telegram-боты для пробива
  • 2 Telegram-боты для пробива и поиска информации
    • 2. 1 Get Contact
    • 2.2 «Глаз Бога»
    • 2.3 AVinfo
    • 2.4 SmartSearchBot
    • 2.5 Quick_OSINT_bot
    • 2.6 Himera
    • 2.7 TeleSINT
    • 2.8 «Архангел»
    • 2.9 GetFB
    • 2.10 Mailsearchbot
  • 3 Заключение

В предыдущей статье, посвященной сыску, мы рассказывали о лучших сервисах для поиска человека по фото. Сегодня продолжим тему и рассмотрим популярные боты Telegram для пробива и поиска персональной информации.

Еще по теме: Угон Телеграм и как от этого защититься

Не­дав­ние разоб­лачитель­ные пуб­ликации извес­тно­го оппо­зици­оне­ра Алек­сея Наваль­ного вско­лых­нули вол­ну небыва­лого инте­реса общес­твен­ности к тенево­му биз­несу, свя­зан­ному с услу­гами про­бива. То, что поч­ти любые дан­ные у нас про­дают­ся и покупа­ются, — не сек­рет, но, говорят, кое‑что мож­но разуз­нать и вов­се бес­плат­но у ботов в «Телег­раме».

Как работают Telegram-боты для пробива

Боль­шинс­тво ботов Telegram, выпол­няющих по зап­росу поль­зовате­ля поиск и выдачу пер­сональ­ных дан­ных, работа­ют по схе­ме OSINT, то есть опи­рают­ся на откры­тые источни­ки, для чего экс­плу­ати­руют API раз­личных служб и интернет‑ресур­сов.

Дру­гие исполь­зуют сли­тые базы дан­ных, но такие сер­висы, во‑пер­вых, не всег­да фун­кци­они­руют ста­биль­но, а во‑вто­рых, испы­тыва­ют проб­лемы с акту­али­заци­ей информа­ции: любая утек­шая в паб­лик база со вре­менем уста­рева­ет и, разуме­ется, не обновля­ется.

Не­закон­ный сбор пер­сональ­ной информа­ции — это наруше­ние закона «О пер­сональ­ных дан­ных» и дру­гих законов РФ. Так­же подоб­ные дей­ствия могут обра­зовать сос­тав прес­тупле­ния по статье 137 УК РФ «Наруше­ние неп­рикос­новен­ности час­тной жиз­ни». Ни автор, ни редак­ция не несут ответс­твен­ности за любые пос­ледс­твия исполь­зования при­веден­ных в этой пуб­ликации све­дений, которые пред­став­лены здесь исклю­читель­но ради информи­рова­ния читате­ля.

Монети­зиру­ются подоб­ные боты либо за счет донатов, либо за счет рек­ламы, или же адми­ны огра­ничи­вают количес­тво бес­плат­ных зап­росов, пос­ле чего бот начина­ет про­сить денег за каж­дую сле­дующую выдачу. Иног­да — если адми­ны ну очень жад­ные — исполь­зуют­ся все методы сра­зу.

Лю­ди ищут пер­сональ­ную информа­цию по раз­ным при­чинам. Кто‑то пыта­ется таким обра­зом отыс­кать сво­их от­равите­лей дол­жни­ков или сим­патич­ную сосед­ку по подъ­езду с боль­шими и кра­сивы­ми си… ними гла­зами. Кто‑то разыс­кива­ет пря­мые кон­такты бло­геров или вла­дель­цев паб­ликов либо пыта­ется из чис­того любопытс­тва пос­мотреть пос­ты в зак­рытых про­филях соц­сетей сво­ей быв­шей.

Еще мож­но по номеру машины отыс­кать мобиль­ный телефон под­резав­шего вас на дороге водят­ла, поз­вонить ему, наз­вать по име­ни‑отчес­тву и веж­ливо поп­росить объ­ясне­ний. Некото­рые «гон­щики» в такие момен­ты почему‑то нем­ного сму­щают­ся. В общем, при­чины могут быть раз­ными, а средс­тво одно: условно‑бес­плат­ные Telegram-боты или услу­ги про­бива, до сих пор широко рек­ламиру­емые в дар­кне­те.

Далее мы рассмотрим боты для поиска информации о человеке, если вас интересует пробив самого пользователя Телеграм, тогда прочитайте статью «Как узнать информацию о пользователе Telegram».

Telegram-боты для пробива и поиска информации

Оче­вид­но, что не все боты оди­нако­во полез­ны. Некото­рые про­сят денег, но в ответ либо не находят акту­аль­ную информа­цию, либо отда­ют откро­вен­ную туф­ту. Дру­гие вро­де бы работа­ют, но нас­толь­ко стран­но, что дос­товер­ность пред­лага­емых ботом дан­ных оста­ется сом­нитель­ной.

Что­бы вы не тра­тили дра­гоцен­ное вре­мя и день­ги на поиск жем­чужин в куче орга­ничес­ких удоб­рений, ваш любимый сайт spy-soft.net про­тес­тировал наибо­лее популяр­ные боты Telegram для пробива и пря­мо сей­час поделит­ся с вами получен­ными резуль­татами. Пог­нали!

Get Contact

  • https://t.me/get_kontakt_bot

Тот самый леген­дарный бот, сыг­равший немало­важ­ную роль в нашумев­шем рас­сле­дова­нии. Бот показы­вает, как имен­но записан номер мобиль­ного телефо­на в адресной кни­ге дру­гих або­нен­тов. Информа­цию железя­ка чер­пает с мобиль­ных устрой­ств або­нен­тов, уста­новив­ших при­ложе­ние Get Contact, поэто­му, если на телефо­нах ваших дру­зей эта прог­рамма не уста­нов­лена, никаких дан­ных вы не получите. В день бот поз­воля­ет отпра­вить не боль­ше трех телефон­ных номеров.

В моем слу­чае на все без исклю­чения зап­росы бот выдавал один и тот же ответ:

Result: <wbr />Nothing <wbr />found

При этом поиск по име­ни бота в «Телег­раме» выда­ет пару десят­ков резуль­татов, отли­чающих­ся друг от дру­га одной или парой букв (get_kontact_bott, get_kontakts_bot и так далее) — видимо, на вол­не воз­росшей популяр­ности про­екта чис­ло жела­ющих поиметь с это­го про­фит тоже рез­ко уве­личи­лось.

Некото­рые служ­бы, вро­де @Getcontact_official_bot, с ходу тре­буют зап­латить 200 руб­лей за под­клю­чение к сер­вису. При­том ни один из этих ботов, в общем‑то, не работа­ет.

Не знаю, с чем имен­но свя­зано это досад­ное явле­ние — с наруше­нием в логике сер­виса или с вне­зап­ным нап­лывом кли­ентов, но поль­зовать­ся сей­час Telegram-ботом Get Contact — бес­полез­ная тра­та вре­мени.

«Глаз Бога»

  • https://t. me/EyeGodsBot

Еще один популяр­ный бот, упо­минав­ший­ся в ряде недав­них жур­налист­ских пуб­ликаций. Бот обла­дает доволь­но‑таки обширным набором фун­кций: поиск по име­ни в прос­том тек­сто­вом фор­мате, по номеру авто­моби­ля, по номеру телефо­на, по адре­су элек­трон­ной поч­ты, по наз­ванию юри­дичес­кого лица или ИНН.

Telegram-бот «Глаз Бога»

Для отправ­ки команд бот тре­бует под­писать­ся на собс­твен­ный канал, но даже это не гаран­тиру­ет резуль­тата. По телефо­ну «Глаз Бога» выда­ет наз­вание опе­рато­ра и его реги­он (видимо, для тех, кто не уме­ет опре­делять эти дан­ные на глаз), воз­можное имя (я ввел нес­коль­ко телефон­ных номеров — име­на сов­пали).

Еще он может най­ти поч­товые адре­са (веро­ятнее все­го, по базе адми­нис­тра­торов доменов), стра­ницу «ВКон­такте», акка­унт «Телег­рам», WhatsApp, чис­ло инте­ресо­вав­шихся пер­сонажем до вас. Но эту информа­цию бот пре­дос­тавит за 30 руб­лей.

То же самое каса­ется поис­ка по номеру авто­моби­ля: бес­плат­но бот показы­вает толь­ко реги­он (который мож­но опре­делить и так), а за трид­цатку пред­лага­ет ска­чать отчет «Авто­кода». При этом дан­ные об авто­моби­ле по его номеру при желании нет­рудно отыс­кать в этих ваших интерне­тах бес­плат­но.

Ес­ли вы вве­дете адрес элек­трон­ной поч­ты, бот любез­но покажет вам логин (то, что до сим­вола
@) и домен (то, что пос­ле
@) — это осо­бо цен­ная информа­ция! Так­же вам пред­ложат купить адрес при­вязан­ной к это­му мылу стра­нич­ки «ВКон­такте» и свя­зан­ные с email пароли из какой‑то сли­той базы. По име­ни бот ищет толь­ко номер телефо­на в задан­ном реги­оне, находит неп­равиль­ный и для его прос­мотра пред­лага­ет купить под­писку.

В общем и целом, поль­за от это­го бота показа­лась мне весь­ма сом­нитель­ной: инфу, которую «Глаз Бога» отда­ет бес­плат­но, мож­но при желании нагуг­лить и без него, а плат­ная информа­ция скуд­на и не всег­да дос­товер­на.

AVinfo

  • https://t.me/AVinfoBot

Бот для про­вер­ки дан­ных об исто­рии авто­моби­ля по гос­номеру, VIN, номеру ПТС, ФИО или телефо­ну вла­дель­ца, что теоре­тичес­ки поз­воля­ет выявить «переку­пов». С его помощью нет­рудно уста­новить собс­твен­ника тран­спортно­го средс­тва, под­перше­го ваше вед­ро на сто­янке у супер­марке­та. Воз­можнос­ти у бота доволь­но широкие, а цена отно­ситель­но невысо­кая: один отчет сто­ит 150 руб­лей, но мож­но купить под­писку.

Telegram-бот AVinfo

По номеру телефо­на мож­но най­ти про­филь «ВКон­такте» и опуб­ликован­ные объ­явле­ния о про­даже машин, что теоре­тичес­ки поз­воля­ет вычис­лить перекуп­щиков. А по гос­номеру тран­спортно­го средс­тва или VIN бот фор­миру­ет и пред­лага­ет купить отчет. В него вхо­дят пол­ные све­дения об авто­моби­ле, его собс­твен­никах, про­беге, всех ранее исполь­зован­ных гос­номерах, дан­ные об огра­ниче­ниях, розыс­ке, наличии стра­хов­ки и ДТП, о работе в так­си, о судеб­ных решени­ях в отно­шении машины и име­ющих­ся штра­фах.

В целом информа­ция край­не полез­ная, если вы собира­етесь при­купить себе тач­ло, что­бы с ветер­ком катать под­ругу по ули­цам ноч­ной Мос­квы, и при этом жела­ете узнать, не соб­рана ли эта лас­точка из двух битых ведер где‑нибудь в Дагес­тане. Но для прос­того поис­ка све­дений о собс­твен­нике авто этот объ­ем дан­ных явно излишний.

Ес­ли зай­ти на канал бота, но не заказы­вать у него плат­ных услуг, через некото­рое вре­мя он пред­ложит получить один тес­товый отчет на халяву. Я выб­рал отчет по номеру телефо­на, в котором бот обна­ружил… толь­ко зарегис­три­рован­ную на этот номер левую стра­нич­ку «ВКон­такте».

Объ­явле­ний на «Ави­то» и «Юле» он не нашел (веро­ятно, потому, что мои акка­унты при­вяза­ны к ано­ним­ным сим­кам), авто­мобиль — не най­ден (он зарегис­три­рован на дру­гого челове­ка, лол), в базе нед­вижимос­ти так­же пус­то. В общем, дан­ные по гос­номеру машины AVinfo, может, и спо­собен соб­рать, а вот с про­бивом номеров мобиль­ников дела у него явно обсто­ят неваж­но.

SmartSearchBot

  • https://t.me/smart_searchbot

До­воль­но инте­рес­ный бот, поз­воля­ющий искать по номеру телефо­на (выда­ет имя поль­зовате­ля, реги­он, город, email, стра­нич­ку во «ВКон­такти­ке», ник и ID в «Телег­раме», если таковые есть), по email (воз­вра­щает телефон, имя, стра­ницу «ВК» и город), по номеру тран­спортно­го средс­тва, нику или име­ни в соц­сетях, а так­же по фотог­рафии — бот ищет похожие.

Бес­плат­но бот поз­воля­ет выпол­нить толь­ко два зап­роса, пос­ле чего про­сит опла­тить под­писку: суточ­ная сто­ит в рай­оне 67 руб­лей, что, в общем‑то, недоро­го. Я решил пот­ратить на бла­гое дело столь нес­кром­ную сум­му и потес­тить бот — исклю­читель­но в науч­ных целях.

По нес­коль­ким вве­ден­ным мною авто­мобиль­ным номерам бот не нашел вооб­ще ничего. С номера­ми мобиль­ника дела обсто­ят получ­ше: информа­ция находит­ся, и вро­де как даже более‑менее релеван­тная, но по нес­коль­ким ука­зан­ным мною номерам бот выдал толь­ко реги­он опе­рато­ра и имя юзе­ра, видимо из чьей‑то запис­ной книж­ки, — никаких допол­нитель­ных све­дений обна­ружить не уда­лось.

По фамилии, име­ни и отчес­тву бот выда­ет наз­вание орга­низа­ции, с которой может быть свя­зано это лицо, непол­ный адрес (город, ули­ца) и ИНН: видимо, поиск выпол­няет­ся по базе юри­дичес­ких лиц и ИП. Часть резуль­татов содер­жат толь­ко номер мобиль­ного телефо­на.

Если фамилия рас­простра­нен­ная, резуль­татов может най­тись мно­го, поэто­му при­дет­ся уточ­нять зап­рос ком­бинаци­ей ФИО и даты рож­дения или ФИО и города про­жива­ния. Тем не менее мои экспе­римен­ты с ботом показа­ли, что базы он исполь­зует ста­рые, как иско­паемые экс­кре­мен­ты динозав­ра: все най­ден­ные им мобиль­ные номера из скор­млен­ного мною тес­тового пула ФИО дав­ным‑дав­но про­тух­ли.

До­воль­но пол­ные све­дения бот выда­ет по email — тут и стра­нич­ка в «ВК», и при­вязан­ный к ней номер мобиль­ного, и пол­ное имя, ука­зан­ное в про­филе поль­зовате­ля. Любопыт­ный резуль­тат мож­но получить по зап­росу «исто­рия ВК».

Даже если про­филь юзе­ра зак­рытый, SmartSearchBot выкачи­вает отту­да нес­коль­ко фотог­рафий и воз­вра­щает информа­цию за нес­коль­ко минув­ших лет. Эта фун­кция может ока­зать­ся полез­ной, если юзер уда­лил и почис­тил свой про­филь «ВКон­такте» — по край­ней мере, бот поможет узнать его дату рож­дения, мес­то житель­ства и работы (если они были ука­заны).

Telegram-бот SmartSearchBot

На­пос­ледок я решил потес­тить поиск по фотог­рафии в соц­сетях — бот поз­воля­ет выпол­нять до трех таких зап­росов в сут­ки. На паре заг­ружен­ных мною фоток SmartSearchBot почему‑то обна­ружил нес­коль­ко лиц (кля­нусь, там было толь­ко одно!), а на дру­гих, где человек раз­вернут в про­филь, не нашел лица вооб­ще.

Методом перебо­ра мне все‑таки уда­лось скор­мить ему неболь­шой набор фотог­рафий. И в целом бот со сво­ей задачей спра­вил­ся — прав­да, для это­го необ­ходимо, что­бы лицо на фото было анфас, а иско­мый юзер сох­ранил в сво­ем про­филе «ВКон­такте» имен­но эту или край­не похожую фотог­рафию.

В целом я бы оце­нил работу Telegram-бота SmartSearchBot на тро­ечку с плю­сом. Вро­де как и ищет, и сре­ди най­ден­ной информа­ции даже попада­ется полез­ная, но боль­ше полови­ны резуль­татов выдачи — откро­вен­ный шлак, который при­дет­ся отсорти­ровы­вать вруч­ную.

Quick_OSINT_bot

  • https://t.me/Quick_OSINT_bot

По сво­им воз­можнос­тям бот в целом похож на SmartSearchBot — он спо­собен искать по телефо­ну, адре­су элек­трон­ной поч­ты, гос­номеру или VIN авто­моби­ля, номеру пас­порта, СНИЛС или ИНН. Инте­рес­ная осо­бен­ность — поиск по паролю: бот ищет в сли­тых базах адрес email, которо­му может соот­ветс­тво­вать задан­ный пароль.

Telegram-бот Quick_OSINT_bot

Тест показал, что номер мобиль­ника по гос­номеру авто Quick_OSINT_bot находит неп­равиль­но, по телефон­ному номеру выда­ет в основном реги­он опе­рато­ра и имя, под которым або­нент записан в телефон­ных кни­гах, а так­же имя, которым он под­писыва­ется на дос­ках бес­плат­ных объ­явле­ний.

Весь­ма поз­наватель­ные резуль­таты получа­ются при поис­ке по адре­су email: бот воз­вра­щает учет­ки с таким адре­сом в раз­личных соц­сетях, ник­ней­мы, номер мобиль­ного, имя и фамилию (не всег­да кор­рек­тно), а так­же свя­зан­ные с этим мылом пароли из сли­тых баз.

Бот поз­воля­ет выпол­нить нес­коль­ко бес­плат­ных зап­росов в сут­ки, пос­ле чего начина­ет клян­чить денег: 0,1 дол­лара за каж­дый отчет или пред­лага­ет офор­мить под­писку.

Himera

  • https://t.me/HimeraSearch_bot

Бот, по слу­хам, под­клю­чен к сис­теме про­вер­ки кон­тра­ген­тов Unirate24, и он плат­ный. Самый дешевый тариф с огра­ниче­нием на количес­тво поис­ковых зап­росов сто­ит 1199 руб­лей. Бот поз­воля­ет искать информа­цию по ФИО, номеру телефо­на, номеру авто­моби­ля, адре­су элек­трон­ной поч­ты, а так­же дан­ным юри­дичес­кого лица. Най­ти он может све­дения о про­пис­ке граж­данина, записи о наруше­нии им закона, дан­ные о родс­твен­никах.

По слу­хам, этот Telegram-бот неп­лохо справ­ляет­ся с поис­ком по Мос­кве и области, а вот с реги­она­ми могут воз­никнуть проб­лемы: там находит­ся не все и не всег­да. Зна­читель­ная часть инфы по юрли­цам есть в сво­бод­ном дос­тупе. Но в целом бот может быть полезен для про­вер­ки кон­тра­ген­тов, потен­циаль­ных деловых пар­тне­ров или, ска­жем, при най­ме мут­ного кан­дидата на работу в золотох­ранили­ще вашего лич­ного бан­ка.

TeleSINT

  • https://t.me/telesint_bot

Бес­плат­ный бот, поз­воля­ющий най­ти по нику, в каких груп­пах в «Телеге» сос­тоит тот или иной поль­зователь. Теоре­тичес­ки эта информа­ция может рас­ска­зать вам что‑то о мо­раль­ном обли­ке инте­ресах и увле­чени­ях инте­ресу­юще­го вас пер­сонажа.

Зна­читель­ный недос­таток это­го бота зак­люча­ется в том, что он показы­вает учас­тие юзе­ра толь­ко в откры­тых пуб­личных груп­пах, а вот зак­рытые паб­лики (то есть самое инте­рес­ное!) оста­ются вне его поля зре­ния.

«Архангел»

  • https://t.me/AngelProbiv_Bot

Бот, активно рек­ламиро­вав­ший­ся в сен­тябре 2020 года на хакер­ских форумах. По слу­хам, он под­клю­чен к информа­цион­но‑ана­лити­чес­кой сис­теме Solaris, исполь­зуемой про­бив­щиками‑про­фес­сиона­лами. База поз­воля­ет искать дан­ные по ФИО, серии и номеру пас­порта, фамилии и году рож­дения, по ИНН, СНИЛС, по адре­су, номеру телефо­на или авто­моби­ля.

Сто­имость одно­го зап­роса «Арханге­лу» до недав­них пор сос­тавля­ла 250 руб­лей, но пос­ле извес­тных событий бот отклю­чили, и сей­час он выда­ет сооб­щение о «вре­мен­ных тех­ничес­ких работах». Оста­ется наде­ять­ся, что проб­лемы там дей­стви­тель­но вре­мен­ные.

GetFB

  • https://t.me/getfb_bot

Бот работа­ет очень прос­то: по вве­ден­ному номеру мобиль­ного телефо­на в меж­дународ­ном фор­мате (+7XXXAAABBCC) GetFB находит зарегис­три­рован­ную на этот телефон стра­нич­ку в Facebook. Денег за свою работу бот не про­сит и работа­ет отменно.

Mailsearchbot

  • https://t.me/mailsearchbot

Бот ищет по сли­тым базам пароли, соот­ветс­тву­ющие адре­сам элек­трон­ной поч­ты, логинам или номеру телефо­на. Бес­плат­но бот показы­вает толь­ко часть обна­ружен­ных паролей, а за пол­ной вер­сией отправ­ляет на сто­рон­ний сайт, где посети­телю с ходу пред­лага­ют опла­тить под­писку.

Заключение

Мои экспе­римен­ты показа­ли, что боты для поис­ка пер­сональ­ных дан­ных в целом могут быть полез­ны, но с неболь­шими ого­вор­ками:

  • боль­шинс­тво из них — плат­ные, и качес­тво поис­ка информа­ции там все рав­но сред­нее, выдачу при­дет­ся верифи­циро­вать и переби­рать вруч­ную;
  • есть пара бес­плат­ных вари­антов с огра­ниче­нием на количес­тво зап­росов, но в выдаче при­сутс­тву­ет высокий про­цент шла­ка.

Да­же нес­мотря на то, что боль­шинс­тво ботов исполь­зует одни и те же источни­ки информа­ции, для уточ­нения дан­ных луч­ше при­менять сра­зу нес­коль­ко инс­тру­мен­тов — это повысит релеван­тность поис­ка и качес­тво резуль­татов. Тем не менее для серь­езно­го рас­сле­дова­ния без услуг про­фес­сиональ­ных про­бивал все рав­но не обой­тись: они име­ют дос­туп к акту­аль­ным слу­жеб­ным базам раз­личных государс­твен­ных и ком­мерчес­ких орга­низа­ций, вер­нее, связь с сот­рудни­ками, которые, в свою оче­редь, могут обра­щать­ся к этим базам.

Бо­ты могут под­ска­зать нап­равле­ние поис­ка и рас­ширить набор исходных дан­ных, но в качес­тве пол­ноцен­ного инс­тру­мен­та для пробива пер­сональ­ных дан­ных они вряд ли сго­дят­ся.

Еще по теме:

  • Сколько стоит пробить человека
  • Лучшие сайты для пробива человека

Российский веб-сайт Avito удвоил доходы

Миа Шэнли

3 Min Read

СТОКГОЛЬМ (Рейтер) — Шведский соучредитель крупнейшего в России сайта объявлений Avito ожидает более чем двукратного увеличения доходов в этом году, доказывая, что более мелкие игроки могут выдержать лидерство в отрасли, где доминируют такие тяжеловесы, как eBay и Craigslist.

Последний стартап Йонаса Нордландера, запущенный в 2007 году, входит в рейтинг Craigslist в США и китайский сайт 58. com с 40 миллионами уникальных посетителей в месяц, и его быстрый рост уже привлек интерес инвесторов.v

«Я думаю, что у них очень хорошие перспективы», — сказал Питер М. Золлман, аналитик Advanced Interactive Media Group.

«Я бы, конечно, сказал, что Avito создал хорошие возможности, но я бы не сказал, что их будущее уже гарантировано. Это очень, очень ранний рынок».

Доход Avito в 2012 году составил 30 миллионов долларов. Согласно отчету AIM, доход Craigslist, самого популярного в мире сайта объявлений, в прошлом году составил около 126 миллионов долларов.

Avito еще не приносит прибыли, и его охват далеко не так широк, как eBay, норвежский Schibsted или южноафриканский Naspers, каждый из которых владеет десятками онлайн-брендов по всему миру.

Но это может быть началом экспансии на новые рынки, такие как Иран, Бангладеш или Пакистан. Недавно он был запущен в Египте и Марокко.

В прошлом месяце Naspers выкупила около 20% акций фирмы и объединяет свои российские сайты с Avito.

Среди других инвесторов — шведские Kinnevik и Vostok Nafta, а также венчурные компании Accel и Northzone — одни из первых спонсоров Spotify.

Партнер Accel Сонали де Рикер отметила, что более 90% онлайн-роста в России приходится на регионы, где, по ее словам, все больше людей выходят в интернет в поисках товаров и услуг.

«Из-за отсутствия инфраструктуры для розничной торговли часто лучше всего подходит местная торговая площадка», — сказала она.

Сайт Avito служит местом встречи покупателей и продавцов всего, от недвижимости до домашних животных и рабочих мест, причем каждый пятый подержанный автомобиль, проданный в России, торгуется на сайте.

«Я был бы очень разочарован, если бы мы не увеличили выручку более чем вдвое по сравнению с прошлым годом», — сказал Нордландер, который в 2006 году продал шведский сайт объявлений eBay и пообещал держаться подальше от его территории в течение двух лет.

Быстрый рост за пределами Санкт-Петербурга и Москвы, новые поступления от малого и среднего бизнеса и продажи рекламы будут стимулировать рост в этом году.

Есть куда расти. Только 60 процентов 140-миллионного населения России имеют доступ к Интернету.

Нордландер, который вместе с соучредителем Филипом Энгельбертом владеет 15 процентами Avito, считает, что компания может быть кандидатом на поглощение, но пока к нему не обращались.

Листинг в Лондоне или Нью-Йорке может быть более вероятной альтернативой, хотя это еще только начало.

«Я думаю, что эта компания готовится к IPO, потому что оно будет слишком большим», — сказал он.

Репортаж Мии Шэнли; Под редакцией Алистера Скраттона и Дэвида Коуэлла

Kaggle и индустрия через призму конкурса Avito

Конкурс Avito заключался в прогнозировании незаконного содержания в тематических объявлениях. Это сводилось к классификации текста на русском языке. Мы предлагаем обзор того, что сработало для лучших участников, и некоторые мнения о том, чем соревнования Kaggle отличаются от реальности в отрасли.

Поскольку в этой статье несколько русских акцентов, давайте проясним, что мы бы предпочли, чтобы Россия жила в мире, а не воевала на Украине. Это трудная задача, но, может быть, со временем русские станут лучше руководить.

Учебный набор содержал примерно 1,3 миллиона записей, каждая из которых состояла из заголовка, описания, некоторых атрибутов ( пар ключ:значение ), назначения категории и подкатегории и нескольких числовых характеристик, включая цену.

Наше решение было довольно типичным для крупномасштабной классификации текста (и регрессии, если на то пошло): используйте пару скриптов Python для ввода и вывода данных, пусть Vowpal Wabbit сделает все остальное.

Метрика оценки: средняя точность , используется для ранжирования. Контрольный показатель лучших прогнозов Avito составлял 0,927, и мы надежно превзошли его, достигнув 0,971, что соответствует примерно 25-му процентилю в итоговой таблице лидеров. Победители получили 0,987. Показатель ROC AUC находился в аналогичном диапазоне. Обратите внимание, что это довольно высокие цифры.

Более широкий взгляд

Мы считаем, что при реальном внедрении машинного обучения существует компромисс между сложностью решения и его производительностью с точки зрения оценки. В случае с Avito, они, вероятно, захотят, чтобы лучшие прогнозы помечались для проверки модератором, возможно, автоматически деактивировались, если классификатор действительно уверен. Вероятно, это не имеет большого значения, если показатель равен 0,9.6 или 0,97 или 0,98 или 0,99. Если объявлений действительно много, возможно, будет дешевле нанять еще одного модератора, чем добиваться лучших результатов.

С другой стороны, для тяжеловесов рычаг настолько велик, что небольшие улучшения действительно имеют значение, как отмечено в этом докладе: Сивилла: Система для крупномасштабного машинного обучения в Google.

Дело в том, что есть точка убывающей отдачи. Соревнования Kaggle выигрываются путем тщательного улучшения оценки на крошечную долю, обычно за счет разработки функций, создания различных наборов функций и объединения моделей. Пройти этот путь в производстве было бы довольно сложно.

Одним из доказательств является знаменитый конкурс Netflix. Люди трудились в течение трех лет, чтобы получить целевой балл, и большую часть времени ушло на то, чтобы пройти последнюю милю. В конце концов это привело к значительному росту матричной факторизации и общих исследований в области машинного обучения, но Netflix не реализовал выигрышное решение:

чтобы оправдать инженерные усилия, необходимые для внедрения их в производственную среду.

Не все идет так гладко, как производство слизи в Северной Корее.

Что сработало на этот раз

Допустим, вы не работаете в отрасли, а просто хотите подняться на вершину таблицы лидеров. Как люди это делают, в частности? Обычно в конце участники размещают информацию о своем подходе, а иногда и свой код на форуме конкурса. Это фантастический способ учиться, особенно если вы сами принимали участие.

Несколько наборов функций

Кажется, что победители действительно далеко продвинулись в подготовке различных наборов функций и изучении различных моделей для каждого набора, наконец, объединив прогнозы, чтобы получить более высокий балл. Прислушайтесь к признаниям barisumog (1-е место с Джулио):

  1. извлеките необработанный текст из каждого сообщения, объединив разделы заголовка, описания и атрибутов (мы пробовали множество других функций, некоторые работали для Джулио, но не для меня. Я использовал только текстовые функции)
  2. для каждой категории и подкатегории, создайте 3 матрицы tf-idf: одну с необработанным текстом, одну с основами и одну со стоп-словами (по отдельности они дали похожие результаты, но я заметил, что они немного улучшили оценку и стали более стабильными, когда вместе)
  3. для каждой категории и подкатегории, обучить 2 набора SVC с разными параметрами C на каждом tf-idf (опять же, аналогичные результаты по отдельности, но немного лучше в сочетании)
  4. , так что теперь у меня есть 2 x 3 SVC для каждой категории и 2 x 3 SVC для каждой подкатегории (12 моделей для использования для каждой точки данных)

И Михаил Трофимов (2 место):

Наш подход очень похож на описанный Джулио. Мы используем разные фрагменты данных (заголовок, заголовок+описание, заголовок+описание+атрибуты, заголовок+атрибуты) и сделали 3 уровня детализации для каждого (топ-100 тыс. слов, все слова, все пары слов). Для всех этих наборов функций была обучена SVM, для некоторых — дополнительные модели LibFM. Только они дают 0,97 — 0,983.

TF-IDF

Частота термина — обратная частота документа — метод предварительной обработки текста. Его цель — придать больший вес редко встречающимся словам, особенно если они часто встречаются в данном документе:

Значение tf-idf увеличивается пропорционально количеству раз, которое слово встречается в документе, но компенсируется частотой слово в корпусе, что помогает контролировать тот факт, что одни слова вообще встречаются чаще, чем другие.

Его использование в этом соревновании было оплачено, но, к сожалению, Vowpal Wabbit не реализовал его. В Scikit-learn есть TfidfVectorizer.

Повторное обучение классификатора на его собственных предсказаниях

Победители использовали метод, который они называют «обучение с полуучителем», вероятно, из-за отсутствия лучшего определения. Идея состоит в том, чтобы обучить модель, получить прогнозы для тестового набора, затем использовать их в качестве меток и повторно обучить на обучающих и тестовых наборах. В результате классификатор становится более уверенным в своих прогнозах, поскольку в основном получает положительную обратную связь.

Эта техника уже использовалась на соревнованиях. Йошуа Бенжио сказал, что Он поддерживает разделение между классами с низкой плотностью, что обычно считается приоритетом для задач классификации в машинном обучении . Вот соответствующая ветка форума.

кНН

Проклятие размерности? Какое проклятие размерности? Видимо kNN с большим k и косинусным сходством дали хорошие результаты. Минус: очень медленно. Есть способы ускорить его, например, google-all-pairs-similarity-search.

Машины факторизации

Майкл Ярер сообщает, что использовал libFM для получения 0,98.

Отдельные модели для каждой категории

Объявления делятся на разные категории и подкатегории.