алгоритмы Archives

Google хорош ;)

Попробовал искать по своим фотографиям в G+, получилось неплохо. Бывает, ошибается, но многое находит верно:

sea

 Да, панда не в море, она в зоопарке 😉 Правда, кейс сложный — снег на траве под лапами панды очень смахивает на пену прибоя :)

А с ночными фотографиями все отлично получилось:

night

И с тигром в пекинском зоопарке тоже:

tiger

Круто, технологии :)

Шикарное видео про системы рекомендаций и поиск в оффлайн :)

Устройство Пингвина :)

Имхо, неплохая статья: «Penguin Analysis: SEO Isn’t Dead, But You Need to Act Smarter». Microsite Masters проанализировали динамику в Google по нескольким тысячам доменов. Возможные критерии визита Пингвина:

Переспам анкор-листа

Как видно, существенно пострадали сайты, анкор-лист которых в существенной степени состоял из ключевых слов.

Отсутствие естественных ссылок

Мы исследовали естественный коммерческий анкор-лист на примере нескольких коммерческих, но не имеющих seo-ссылок, проектах. Выяснили, что чаще всего анкором выступает url или домен. Очевидно, в большинстве случаев «оптимизированный» анкор-лист выглядит иначе. Распределение от Microsite Masters по типу самых частых анкоров:

Видно, что риск встречи Пингвина высок, если наиболее частыми компонентами анкор-листа являются ключевые слова.

Низкая релевантность доноров

Видна неплохая корреляция с долей нерелевантных доноров.

Пути выхода из-под санкций и снижения рисков очевидны: нужно улучшать качество ссылочного. Можно мотивировать пользователей размещать ссылки, использовать партнерские отношения с тематическими порталами и пр. Имхо, уже давно стоит рассматривать ссылку не как инструмент влияния на робота, а как инструмент влияния на пользователя. Хорошая ссылка обеспечивает трафик и конверсию.

Антиспам от seo-команды

Примерно месяц назад Ирина Борисова, лингвист из отдела поисковой аналитики, выступила на конференции «Прикладная лингвистика и искусственный интеллект 2012» с докладом «Лексическая статистика в оценке качества коммерческих текстов».

Коллеги проявили большой интерес к её выступлению. Это понятно, поскольку речь шла о совершенно неординарном для seo-рынка событии — разработке антиспама. Ирина рассказала о некоторых подходах и методах для оценки качества и спамности текстов. Презентация доклада:

Хочется верить, что тренд на «обеление» seo будет поддержан рынком, ведь аналитика и маркетинговые исследования дают гораздо больший профит, чем примитивный спам поисковых машин.

Поиск от Facebook

На самом деле серьезная новость — Facebook строит поиск:

Facebook is unlikely to go toe-to-toe with Google for algorithmic supremacy. While Google controls 67 percent of the search market in the U.S. and has sophisticated technology to track a trillion Web pages, Facebook employs few, if any, traditional search engineers, who typically have deep expertise in fields such as information retrieval and natural language processing. But the company has a lot of social data it can apply to the problem of organizing information. Instead of crawling and ranking the whole Web, as Google does, Facebook already allows users to avidly flag the most interesting content, such as the best articles, recipes, and shopping deals. Improving Facebook search in some ways means just making more effective use of that data.

Businessweek Technology

Задаем вопросы поиску!

В пятницу Андрей Калинин, руководитель разработки поиска Mail.ru, ответит на вопросы. Пользуемся случаем, спрашиваем :)

Алгоритмы — доступно :)

Не могу не поделиться — алгоритм сортировки в венгерском танце :)

 

Спасибо itman’у за наводку :)