Сегодня на searchengines.ru выявили факт индексации поисковыми системами sms-ок, отправляемых через сайта Мегафона. Очевидно, первопричина — халатность веб-мастеров Мегафона, не закрывших индексацию ресурса поисковыми системами. В нынешнее время роботам поиска не нужно особое приглашение, они обнаруживают новый контент любыми способами (например, по информации от собственных баров), а обнаружив — пытаются индексировать все, что не запрещено.

Этот случай в очередной раз подтверждает прописную истину: хотите сохранить конфиденциальность — позаботьтесь об этом.

С точки зрения IR интересны особенности корпуса коротких текстов (разумеется, корпус не содержал персональных данных):

Распределение по длине сообщения

Самые частотные биграммы

Самые частотные триграммы

 

 

Filed under: веб-аналитикаоптимизация сайтовпродвижение сайтов

Like this post? Subscribe to my RSS feed and get loads more!