Семантичний пошук: інтелект для пошукової системи.

Той, хто звертається з питанням до пошукача, отримує посилання, а той, хто запитує у Wolfram Alpha , отримує відповіді. «Машина знань» математичного генія Штефен Вольфрама (Stephen Wolfram) на питання про температуру у вашому місті видасть графік зміни температури за тиждень та прогноз на найближчі дні.

На запит про кількості користувачів Інтернету інтелектуальна пошукова система Wolfram Alpha відповість числом 289 900 000 і кількістю користувачів у п'яти найбільших країнах, у той час як стандартний пошуковик надасть посилання на веб-сторінки безлічі сайтів, на яких доведеться шукати потрібні дані самостійно.

Але чи здатна Wolfram Alpha, яку запустять вже цього місяця, дати гідну відсіч лідерам мережевого пошуку, зокрема Google? Фахівці в області семантичного Інтернету стверджують, що ні: Wolfram Alpha - відмінна розробка, але безумовно не Google-killer. Причина, насамперед, в тому, що Wolfram Alpha «прочісує» не весь колосальний Інтернет, а лише обмежене число відкритих і ліцензованих джерел.

Сам Штефен Вольфрам вважає, що вибір якісних джерел грає вирішальну роль у його розробці, в усякому разі, так він заявив в онлайн-презентації Wolfram Alpha. Дані цих джерел будуть перероблятися у відповідності з правилами так званого семантичного Інтернету. Природному мови будуть додані жорстко певні значення, так щоб їх розумів комп'ютер. Тільки тоді машина зможе миттєво виконати пошуковий запит, зв'язавши кілька розрізнених даних у нове знання, і видасть замість посилань дійсні відповіді.

Семантика зробить пошук зайвим

Навіть якщо ні Wolfram Alpha, ні інші семантичні пошукові машини, такі як Powerset або Hakia, не здатні протистояти алгоритму Google, все ж саме семантичний Інтернет вважається ключем до мережного пошуку наступного покоління.

Ця концепція була розроблена ще в 1990-і роки винахідником Інтернету Тімом Бернерс-Лі (Tim Berners-Lee) і спрощена проектом Linked Data Projekt 2006, а зараз покидає лабораторії дослідників, щоб увірватися в новий світ практичного застосування. Першими випробувальними полігонами стають підприємницькі мережі, тому що обсяг даних в них легко може бути обмежений.

Окремі компанії з'єднують існуючі обсяги даних одна з одною. Семантичний пошук повинен давати кращі результати в порівнянні зі звичайним повнотекстових, тому що результати пошуку представляються структуровано, впорядковані за категоріями і дозволяють швидше знаходити потрібну інформацію. Не вдаючись в технічні деталі, можна сказати, що в ідеальному варіанті співробітники можуть взагалі заздалегідь визначити характер бажаної інформації і при запиті даних отримають саме те, що шукали. Одним словом, семантика зробить сам пошук непотрібним.

Наступним Google стане сам Google

Переваги семантичного Веба потім можна буде перенести й у відкритий Інтернет.


Першим великим кроком у мережевому пошуку стане відмова від довгих списків з результатами пошуку. Пошукове простір стане структурованим, а пошук перетвориться на свого роду прогулянку повз вітрин з виставленими даними. Між результатами пошуку будуть встановлюватися зв'язку, і самі результати таким чином будуть упорядковуватися.

В інтелектуальному пошуковику користувач зможе знайти відповідну групу результатів і швидше відшукає потрібну інформацію, ніж у звичайному довгому списку посилань

Але семантичний пошук зможе зацікавити широкий ринок , лише якщо обсяг структурованих, перероблених даних буде досить великим. Побудова масиву даних необхідного розміру вимагає відповідної інфраструктури, а тому забезпечити його не зможе жоден стартап.

Експерти вважають, що якщо хтось зуміє зробити семантичну революцію в Інтернеті і представити Веб нового покоління , то це буде тільки сам Google. Адже обчислювальна потужність, необхідна для перетворення існуючих в Інтернеті даних у нове знання, колосальна, а у Google такі можливості вже є.

Те, що Інтернет-гігант і сам мислить у тому ж напрямку , підтверджують слова представників Google. Вони заявляють, що постійно з'являються нові пошукові машини, широко рекламуються в пресі, однак і сам Google постійно працює над цими новими техніками, впроваджуючи їх, якщо це робить його роботу краще й ефективніше.

Винахідник концепції Web 2.0 Тім О'Рейллі (Tim O'Reilly) теж не вірить у «убивць Google» і впевнений, що всі ті пошукові машини, які хотіли стати наступним Google, нічого не добилися, а нещодавно зазнав аварії і найамбітніший з них проект Cuil. О'Рейллі упевнений, що наступним Google буде сам Google, тобто що саме Google встане на чолі семантичного пошуку.

Яку нову машину готує Microsoft?

Схоже, що тільки у комп'ютерного гіганта Microsoft є достатньо грошей, щоб брати участь в гонці за лідерство з Google: торік Microsoft за суму в кілька сотень мільйонів доларів придбала спеціальну силову установку. Хоча Microsoft місяць за місяцем поступається концерну Google частку на ринку і гаманці споживачів, вона ще далека від поразки.

За словами глави Microsoft Стіва Балмера (Steve Ballmer), Google домінує в пошуку, але він ще не виграв битви, і Microsoft не здається. На думку корпорації, простори мережевого пошуку ще далеко не вичерпані, і галузь зберігає суттєвий потенціал для розвитку, якого вистачить на кілька років.

Вже через кілька тижнів корпорація Microsoft може запустити власну інтелектуальну пошукову машину , якій чергове перейменування (після MSN і Live Search система буде називатися Kumo) має надати необхідний імпульс.


Ілля Яковлєв
штат