Особенности корпуса коротких текстов

Сегодня на searchengines.ru выявили факт индексации поисковыми системами sms-ок, отправляемых через сайта Мегафона. Очевидно, первопричина — халатность веб-мастеров Мегафона, не закрывших индексацию ресурса поисковыми системами. В нынешнее время роботам поиска не нужно особое приглашение, они обнаруживают новый контент любыми способами (например, по информации от собственных баров), а обнаружив — пытаются индексировать все, что не запрещено.

Этот случай в очередной раз подтверждает прописную истину: хотите сохранить конфиденциальность — позаботьтесь об этом.

С точки зрения IR интересны особенности корпуса коротких текстов (разумеется, корпус не содержал персональных данных):

Распределение по длине сообщения

Самые частотные биграммы

Самые частотные триграммы

 

 

«Базовые потребности пользователей», Яндекс.

Любопытный слайд из презентации Сергея Петренко, Яндекс:

Rich snippets vs CTR & conversion rate

Интересный вопрос. Как обогащение сниппета ценой и информацией о доставке повлияет на ctr из выдачи и внутрисайтовую конверсию? Логично было ожидать, что изменение ctr будет коррелировать с уровнем цены на товар: предложения с ценой ниже среднего получат больше кликов, а относительно более дорогие товары — меньше.

С другой стороны, указание цены в сниппете очевидно повышает конверсию, поскольку явно растет релевантность сниппета документу.

Эти догадки были подтверждены на ряде клиентских сайтов, но детальных исследований не проводилось.

Тем интереснее было обнаружить цифры из первых рук (презентация Вадима Францева из Яндекса):

Обсуждаем поисковый антиспам — завтра на megaindex.tv!

Оставляйте вопросы, постараемся ответить в эфире. Станислав Ставский в моей программе «Аналитикум» на megaindex.tv. Смотрите, будет интересно :)

Аналитика в интернет-коммерции

На Megaindex.tv выложена передача с Ромой Зыковым. Безусловно рекомендую. Рома построил аналитику в Озоне, консультирует крупнейшие магазины и руководит аналитической службой в Викимарте.

Часть I

Часть II

Презентации Яндекса на РИФ+КИБ-2011

Выложили сегодня на http://company.yandex.ru/public/conferences/.

Кое-что полезное можно найти на аккаунте Яндекса на slideshare 😉

Завтра в 11 утра Роман Зыков расскажет о своем богатом опыте построения аналитических систем в рамках моей передачи «Аналитикум» канала Мегаиндекс.ТВ. Будет освещено много практических вопросов и решений, Рома расскажет об интересных кейсах и приведет цифры. Будет интересно, смотрите!

Несколько дней назад я вел программу на Мегаиндекс.ТВ, в которой мы со Станиславом Ставским обсуждали возможности учета поведения пользователей для ранжирования документов. Главный фокус программы:  попытки накруток поведенческих факторов, реакция поиска на эти действия, перспективы. Наша точка зрения состоит в том, что у поиска много возможностей эффективно обнаруживать накрутки, что мы проиллюстрировали на примерах. Поэтому целесообразнее тратить время и ресурсы на улучшение сайта, что обеспечит естественное улучшение ранжирования.

При этом, конечно, хорошо бы понимать, что именно учитывают поисковые системы при анализе поведения пользователей в выдаче и на сайтах. Как ни странно, весьма немногие оптимизаторы и вебмастера знают о BrowseRank, технологии учета поведения пользователей от Microsoft (pdf, англ.). Хотя этой разработке уже 3 года, полагаю, она вполне актуальна. Read the rest of this entry

Реакция Яндекса на накрутку поведенческих факторов

Что же, давно ожидаемое событие произошло: Яндекс пессимизировал сайты, для которых накручивались поведенческие факторы.

С одной стороны, неплохо, что Яндекс пытается пресечь этот тренд в зародыше. В конце концов, учет поведенческих факторов — основной способ увести оптимизаторов от парадигмы ссылочного спама как единственного метода достижения позиций.

Вероятно, Яндекс учел прошлый урок, когда реакция на манипулирование ссылочным явно запоздала и многократно усложнилась ввиду масштаба явления. Пресечь злоупотребление ссылочным оказалось непросто, поскольку ссылками продвигаются и вполне качественные сайты. Таким образом, то самое «пользовательское счастье», о котором заботится команда Яндекса, однозначно пострадает при отключении или серьезном поражении ссылочного ранжирования, а это недопустимо. Поэтому мы видим постепенный процесс снижения роли ссылочного и замещения его другими факторами, в первую очередь — поведенческими.

С другой стороны, возникают вопросы о применении санкций. Понятно, что накрутка поведенческих может быть инициирована не только владельцем сайта. Соответственно, самая разумная реакция поиска —  игнорировать накрутку. Так ли это сейчас — большой вопрос. Возможно, Яндекс решил пойти по пути Google и это «публичная порка» нарушителей, аналогичная истории с J.C. Penney.

В любом случае, я желаю удачи Яндексу в борьбе с накрутками поведенческих и поздравляю с удачным размещением :)

А мы продолжим этот разговор со Станиславом Ставским в прямом эфире Megaindex.tv в пятницу, в 13.00, в программе «Обмани менЯ: теория фактов». Смотрите и задавайте вопросы :)

Инженеры поиска из Google

Мэтт Каттс выложил в блоге видеообращение инженеров поиска Google.

Любопытно, что Trystan Upstill, программист поиска, нарисовал ровно ту же функцию отображения, что я использовал неделю назад для нормировки объема текста потенциальных ссылочных доноров. Я не сторонник конспирологических теорий, но что-то в этом есть :)

PS. Это общий вид функции, реально все чуть сложнее.

Страница 7 из 15« Первая...56789...Последняя »