Поисковая система ChaCha (ЧаЧа) работает персонально с каждым пользователем. И если Вы ищете что-то через ChaCha, то для вашего онлайн-поиска компания выделит живого помощника совершенно бесплатно. Планируется, что результаты у такой поисковой системы будут значительно лучше. Молодые поисковики уже атакуют мега-концерны, вводя в оборот инновационные концепции.

Откуда поисковику знать, что действительно необходимо пользователю? Например, если он задает для поиска слово «Golf» — что он имеет в виду: спорт, машину, войну или залив? Последовательность букв одна и та же, а смысл разный. Первое машина обработает без проблем, а со смыслом возникнут проблемы. Поэтому смысловая обработка поисковых запросов — горячая тема в Сети.

Подход поисковой системы ChaCha, где запрос обрабатывает человек, подкупает своей простотой и эффективностью. Когда кто-то ищет традиционным способом, ему приходится копаться в многочисленных результатах, вместо того, чтобы сразу получить нужный ответ. В ЧаЧа, если результаты не отвечают ожиданиям, можно обратиться к «гиду» (Guide), который отыщет то, что нужно.

«Веб-гидами» (Web Guide) ChaCha называет своих поисковых агентов. Звучит как проводник в Интернете и работает по такому же принципу. Рядом со строкой ввода на главной странице находятся две кнопки — для поиска через машину и с помощью гида (Search with Guide). Попробуем найти «Golf». В окне чата слева появляется некая Lisa. «Что я могу сегодня найти для Вас о Golf?» — спрашивает она в ответ, разумеется, по-английски. Допустим, нам нужен обзорный материал о правилах игры в гольф. Информируем об этом Лизу. Пару секунд она ищет и выдает ссылку на страницу United States Golf Association (Американская ассоциация гольфа). Только одна ссылка — ни больше, ни меньше, но именно то, что надо.

С более сложными запросами так же. Поинтересуемся, как изменялся климат в прошлые столетия и введем «Climate Middle Ages» (климат в Средние века). В чат стучится веб-гид Dorothy, уточняет, что мы имеем в виду, и дает ссылку на статью из британской газеты Daily Telegraph и австралийский сайт по нашей теме. На этот раз гид подкачал. Машинный поиск дает гораздо лучшую информацию об истории климата.

Южная Корея была первопроходцем

Конечно, веб-гиды ChaCha не всеведующи, и им нужно где-то находить необходимую информацию, чтобы отвечать на вопросы клиентов. Для этого у поисковых агентов есть банк данных, тот же самый, что используется в ChaCha и при машинном поиске. Каждый день эта база обновляется. Этот принцип впервые стал использовать южнокорейский поисковик Naver (Нэйва).

В 2008 году ChaCha планирует установить версии и для некоторых других языков помимо английского

Стоит упомянуть о том, что Южная Корея — особый случай в Интернете. Это единственная страна, где пока, например, не смог закрепиться Google — с его помощью обрабатывается всего около 2% всех запросов. Дело в том, что модель Navers гораздо лучше модели Google. Отличие Южной Кореи состоит еще и в том, что это страна, где широко распространены высокие технологии. Широкополосные подключения здесь есть практически везде и доступны практически бесплатно. С другой стороны, Южная Корея со своим особенным шрифтом и языком несколько изолирована в культурном плане. Поэтому классические запросы a-la Google не помогают южнокорейцам — слишком мало страниц он может найти по-корейски.

Naver решает эту проблему тем, что не только ищет материалы по всему Интернету, но и предоставляет информацию из собственной уникальной базы данных. Эта база в свою очередь создается самими пользователями Naver, которые добровольно и безвозмездно дополняют ее своими знаниями. Например, когда кто-то интересуется кратчайшим путем от Сеула до Пусана, вопрос — если в базе данных нет нужной информации — направляется другим пользователям. Если кто-то знает ответ, то пишет его во встроенном окне чата. Ответ пересылается тому, кто задал вопрос, и оседает в базе данных, так что он будет использоваться при обработке будущих запросов. Благодаря использованию такой методики, Naver перетягивает на себя почти 70% всех поисковых запросов в стране.

Обычно Naver выдает результаты на корейском языке (шрифт у корейцев тоже особый). Как ни странно, на вопрос о средневековом европейском климате Naver выдает лучший ответ из всех поисковиков — английский текст, старательно составленный кем-то из нескольких разных источников.

ChaCha перенял основную идею Naver и усовершенствовал ее. Это касается как принципа машинного поиска, так и использования в поиске людей. Веб-гиды (поисковые агенты) ChaCha — тоже обычные серферы, сидящие у компьютеров дома. Но в отличие от своих южнокорейских коллег, она получают небольшое вознаграждение: 5 долларов за час. Зато они не составляют собственных текстов и не занимаются редактированием. Их деятельность ограничивается отбором страниц из Интернета.

Проследить смысловой контекст

Недавно созданная в Силиконовой долине компания Powerset (Пауэрсет) тоже считает себя достойным соперником Google. Проект еще находится в разработке, и поисковая машина еще не подключена к Сети. Как и ChaCha, Powerset хочет улавливать смысл поискового запроса, но исключительно машинным путем. Создатели проекта называют свой метод Natural Language Search («поиск на естественном языке»). При поддержке концерна Xerox они сейчас обыскивают Интернет, чтобы собрать все предложения, записанные на всех веб-сайтах. При помощи этой гигантской базы данных и не менее грандиозной математической модели поисковая машина должна будет понимать смысл целых предложений и сможет корректно отвечать на вопросы. Вместо отдельных ключевых слов можно будет ввести полноценный вопрос.

Также на экспериментальной стадии находится поисковая машина основателя Википедии Джимми Уэльса (Jimmy Wales). Поисковик будет отличаться от онлайн-энциклопедии тем, что будет коммерческим проектом. Уэльс тоже делает ставку на поиск по смыслу и тоже планирует, что работу поисковой машины будет поддерживать команда редакторов.

Но и сам Google не стоит на месте. Здесь тоже все больше занимаются проблемой смыслового поиска и уже незаметно ввели на некоторых языках (например, на английском и немецком) новую функцию. Если пользователь ведет поиск многозначного слова, внизу страницы появляется опция, позволяющая выбрать одно из значений слова.

By Ruslan Novikov

Интернет-предприниматель. Фулстек разработчик. Маркетолог. Наставник.