Пошукові системи ... живі помічники.

Пошукова система ChaCha (Чача) працює персонально з кожним користувачем. І якщо Ви шукаєте що-то через ChaCha, то для вашого онлайн-пошуку компанія виділить живого помічника абсолютно безкоштовно. Планується, що результати в такої пошукової системи будуть значно краще. Молоді пошуковики вже атакують мега-концерни, вводячи в обіг інноваційні концепції.

Звідки пошукачеві знати, що дійсно необхідно користувачу? Наприклад, якщо він задає для пошуку слово «Golf» - що він має на увазі: спорт, машину, війну або затока? Послідовність букв одна і та ж, а сенс різний. Перше машина обробить без проблем, а зі змістом виникнуть проблеми. Тому смислова обробка пошукових запитів - гаряча тема в Мережі.

Підхід пошукової системи ChaCha, де запит обробляє людина, підкуповує своєю простотою і ефективністю. Коли хтось шукає традиційним способом, йому доводиться копатися в численних результати, замість того, щоб відразу одержати потрібну відповідь. У чача, якщо результати не відповідають очікуванням, можна звернутися до «гідові» (Guide), який відшукає те, що потрібно.

«Веб-гідами» (Web Guide) ChaCha називає своїх пошукових агентів. Звучить як провідник в Інтернеті і працює за таким же принципом. Поряд з рядком введення на головній сторінці знаходяться дві кнопки - для пошуку через машину і за допомогою гіда (Search with Guide). Спробуємо знайти «Golf». У вікні чату ліворуч з'являється якась Lisa. «Що я можу сьогодні знайти для Вас про Golf?» - Запитує вона у відповідь, зрозуміло, по-англійськи. Припустимо, нам потрібен оглядовий матеріал про правила гри в гольф. Інформуємо про це Лізу. Пару секунд вона шукає і видає посилання на сторінку United States Golf Association (Американська асоціація гольфу). Тільки одне посилання - ні більше, ні менше, але саме те, що треба.

З більш складними запитами так само. Поцікавимося, як змінювався клімат у минулі сторіччя і введемо «Climate Middle Ages» (клімат в Середні століття). У чат стукає веб-гід Dorothy, уточнює, що ми маємо на увазі, і дає посилання на статтю з британської газети Daily Telegraph і австралійський сайт з нашої теми. На цей раз гід підкачав. Машинний пошук дає набагато кращу інформацію про історію клімату.

Південна Корея була першопрохідцем

Звичайно, веб-гіди ChaCha НЕ всеведующі, і їм потрібно десь знаходити необхідну інформацію, щоб відповідати на питання клієнтів. Для цього у пошукових агентів є банк даних, той же самий, що використовується в ChaCha і при машинному пошуку. Щодня ця база оновлюється. Цей принцип уперше став використовувати південнокорейський пошуковик Naver (Нейва).

У 2008 ChaCha планує встановити версії і для деяких інших мов, окрім англійської

Варто згадати про те, що Південна Корея - особливий випадок в Інтернеті. Це єдина країна, де поки що, наприклад, не зміг закріпитися Google - з його допомогою обробляється всього близько 2% всіх запитів. Справа в тому, що модель Navers набагато краща за модель Google. Відмінність Південної Кореї полягає ще й у тому, що це країна, де широко поширені високі технології. Широкосмугові підключення тут є практично скрізь і доступні практично безкоштовно. З іншого боку, Південна Корея зі своїм особливим шрифтом і мовою дещо ізольована в культурному плані.


Тому класичні запити a-la Google не допомагають південнокорейцям - занадто мало сторінок він може знайти по-корейськи.

Naver вирішує цю проблему тим, що не тільки шукає матеріали по всьому Інтернету, а й надає інформацію з власної унікальної бази даних. Ця база у свою чергу створюється самими користувачами Naver, які добровільно і безоплатно доповнюють її своїми знаннями. Наприклад, коли хтось цікавиться найкоротшим шляхом від Сеулу до Пусана, питання - якщо в базі даних немає потрібної інформації - направляється іншим користувачам. Якщо хтось знає відповідь, то пише його у вбудованому вікні чату. Відповідь пересилається того, хто поставив запитання, і осідає в базі даних, так що він буде використовуватися при обробці майбутніх запитів. Завдяки використанню такої методики, Naver перетягує на себе майже 70% всіх пошукових запитів в країні.

Зазвичай Naver видає результати корейською мовою (шрифт у корейців теж особливий). Як не дивно, на запитання про середньовічному європейському кліматі Naver видає кращий відповідь з усіх пошукачів - англійський текст, старанно складений кимось з декількох різних джерел.

ChaCha перейняв основну ідею Naver і вдосконалив її. Це стосується як принципу машинного пошуку, так і використання в пошуку людей. Веб-гіди (пошукові агенти) ChaCha - теж звичайні серфери, що сидять біля комп'ютерів будинку. Але на відміну від своїх південнокорейських колег, вона отримують невелику винагороду: 5 доларів за годину. Зате вони не становлять власних текстів і не займаються редагуванням. Їх діяльність обмежується відбором сторінок з Інтернету.

Простежити смисловий контекст

Нещодавно створена в Силіконовій долині компанія Powerset (Пауерсет) теж вважає себе гідним суперником Google. Проект ще знаходиться в розробці, і пошукова машина ще не підключена до Мережі. Як і ChaCha, Powerset хоче вловлювати зміст пошукового запиту, але виключно машинним шляхом. Творці проекту називають свій метод Natural Language Search («пошук на природній мові»). За підтримки концерну Xerox вони зараз обшукують Інтернет, щоб зібрати всі пропозиції, записані на всіх веб-сайтах. За допомогою цієї гігантської бази даних і не менш грандіозною математичної моделі пошукова машина повинна буде розуміти сенс цілих пропозицій і зможе коректно відповідати на запитання. Замість окремих ключових слів можна буде ввести повноцінний питання.

Також на експериментальній стадії знаходиться Пошукова машина засновника Вікіпедії Джиммі Уельс (Jimmy Wales). Пошуковик буде відрізнятися від онлайн-енциклопедії тим, що буде комерційним проектом. Уельс теж робить ставку на пошук за змістом і теж планує, що роботу пошукової машини буде підтримувати команда редакторів.

Але й сам Google не стоїть на місці. Тут теж все більше займаються проблемою смислового пошуку і вже непомітно ввели на деяких мовах (наприклад, англійською та німецькою) нову функцію. Якщо користувач веде пошук багатозначного слова, внизу сторінки з'являється опція, що дозволяє вибрати одне зі значень слова.


Ілля Яковлєв
www.