То, что компания Microsoft активно разрабатывает собственную поисковую систему, уже давно не секрет. Однако помимо создания эффективного механизма индексирования и ранжирования страниц важно обеспечить защиту от так называемого поискового спама – страниц, с помощью которых искусственно накручивается
рейтинг страницы в базе поисковой системы. Этой проблемой специально занимается группа исследователей в рамках подразделения Microsoft Research.

Исследователи Microsoft называют спамерской веб-страницей такую страницу, единственным предназначением которой является обман поисковых систем и не несущей в себе никакой полезной информации. По мнению исследователей Microsoft, для борьбы с поисковом спамом применимы технологии, похожие на антиспамерские решения для электронной почты и, в частности, фильтрация страниц с использование статистических методов.

Также как байесовские фильтры электронной почты определяют принадлежность письма к спаму, также и поисковые фильтры Microsoft определяют вероятность принадлежности страницы к поисковому спаму на основе анализа ее содержания. В настоящее время технология находится на стадии разработки и отладки. При анализе страницы во внимание принимаются многие факторы: количество доменов, приводящих на один и тот же сайт, длину доменных имен, число ссылок на одной странице и другие факторы.

By Ruslan Novikov

Интернет-предприниматель. Фулстек разработчик. Маркетолог. Наставник.