Електронна бібліотека: цифрова Олександрія.

Всі , що коли-небудь було написано рукою людини, вже незабаром стане доступним на моніторі комп'ютера: так поступово здійснюється мрія про універсальну електронній бібліотеці. Книги поступово відходять у минуле , не витримуючи конкуренції з Інтернетом, адже в Мережі можна практично моментально, не сходячи з місця, тут і зараз, отримати інформацію по конкретній темі. Але пошукачі не завжди видають докладну інформацію, тому народилася мрія про створення повноцінної безкоштовної електронної бібліотеки, яка включала б у себе всі існуючі тексти.

Автор проекту, компанія Internet Archive, домовляється з бібліотеками, наймає копіювальників і разом з усім необхідним обладнанням відправляє їх в бібліотеки. Там копіювальники розгортають свою сканерних станцію і беруться за роботу. Майстер кладе акуратно розгорнуту книгу на особливу підставку і опускає на сторінки скляні пластини, змонтовані буквою V. Після натискання на спеціальну педаль опускаються дві камери, кожна з яких фотографує по сторінці розвороту. V-пластини піднімаються, майстер перевертає сторінку і знову фотографує розворот. Так оцифровують книги, за одну 8-годинну зміну майстер копіює близько 4.000 сторінок.

Одна така сканерна станція розташована в Річмонді, в будівлі бібліотеки Каліфорнійського університету. Тут 11 осіб, відгороджені друг від друга світлонепроникними фіранками, сканують книги з 8 години ранку до 12 години ночі. Тут ніколи не розмовляють, адже робота вимагає зосередженості. Коли вся книга скопійована, номери сторінок звіряються, тому що найпоширеніша помилка - переворот відразу двох або кількох сторінок. Така монотонна робота підходить не кожному, і 20% новачків відсіваються вже через тиждень.

Ченці сучасної епохи

Ці майстри у сканерів - ченці цифрового століття. Середньовічні ченці, які переписували книги для наступних поколінь, називалися переписувачами (scribes). А в Річмонді, навпаки, сканери називаються «писарів» (scribes), а майстри - копіювальники (scanners). Ці копіювальники грають головну роль в новому амбіційному проекті зі створення цифрової бібліотеки майбутнього. Мета проекту полягає в тому, щоб відсканувати, «розпізнати», перетворити на текстові файли та розмістити в Інтернеті всі, що коли-небудь було надруковано людиною. Автори проекту хочуть опублікувати не тільки оцифровані книги, вони збираються піти ще далі і зібрати мультимедіа-файли з репродукціями творів мистецтва, музичними записами і фільмами.

Знятий з файлів текст розпізнається через файн-рідер (Fine Reader), перетворюється в текстові дані і відправляється в Мережу. На жаль, ніхто не звіряє «розпізнаний» текст з оригіналом, для компанії це було б занадто дорого.

Проект Internet Archive вже створив другий за величиною літературний архів світу, і одночасно найбільший безкоштовний архів у світі

Компанія відзняла вже 350.000 книг: це лише близько 1% світової літератури, але серед скопійованих книг є дуже важливі, про існування яких звичайна людина навіть і не підозрює.


Був час, були книги

Остання універсальна бібліотека знаходилася в античній Олександрії Єгипетській. Кожен корабель, приставала до олександрійської гавані, повинен був безкоштовно надати бібліотеці знаходяться на борту сувої з текстами. Служителі бібліотеки старанно копіювали ці тексти і повертали капітану. В епоху свого розквіту антична бібліотека мала у своєму розпорядженні копіями 40% всіх доступних у той час текстів. Але при обороні Олександрії в 1 столітті до нашої ери Цезар наказав спалити бібліотеку, з усього зібрання якого уціліли тільки вавилонські глиняні таблички. За два наступні тисячоліття було написано величезну кількість текстів. Людство зробило більше 30 мільйонів найменувань книг, багато з яких існують тільки в кількох примірниках і розкидані по тисячах бібліотек світу.

«Осиротілі» тексти

15% книг можна без особливих проблем оцифрувати і розмістити в мережі Інтернет для вільного перегляду. Авторські права на них давно минули, так що скласти архів таких текстів, як наприклад, трагедій Шекспіра чи Гете, - справа техніки. Ще 10% книг опубліковані різними видавництвами і знаходяться у продажу. Копіювати такі тексти без згоди видавництва і розміщувати їх в безкоштовному доступі онлайн було б крадіжкою інтелектуальної власності. А щоб отримати дозвіл видавця, доведеться заплатити чималу суму. Тому такі книги поки не розміщують в Інтернет-бібліотеках.

Головна проблема - що залишилися три чверті літературної спадщини. Вони вже не друкуються видавництвами (наприклад, впав інтерес читачів), але термін дії авторських прав ще не закінчився. Такі книги можна знайти тільки в бібліотеці, в букініста або на запорошеним бабусиних полицях. Про те, щоб оцифрувати саме такі «осиротілі» книги, мріяли засновники Internet Archive, але вони здалися. Гордіїв вузол розрубала компанія Google, яка з 2004 року вкладає гроші в промислове сканування книг.

Агенти компанії на вантажівці приїжджають до бібліотеки, де зберігаються «книги-сироти», вантажать їх у машину і везуть на скан-фабрику. Щоб не виникло несподіваних проблем з авторськими правами, місце розташування фабрики приховано. Весь відсканований матеріал включають в мережевій архів Google, вже налічує близько мільйона книг. Тексти, авторські права на які вже минули, можна переглядати вільно.

«Осиротілі» книги знаходяться в обмеженому доступі: користувачеві пропонуються кілька уривків з книги і посилання на бібліотеку, в яку доведеться їхати, якщо книга пробудила інтерес. Скопійовані книги, що все ще знаходяться у продажу, також недоступні повністю, тут сервер знову-таки надасть тільки адресу бібліотеки.

Так що, поки Internet Archive марить про цифрову Олександрії, Google практично підходить до справі: у компанії є ім'я, якому довіряють бібліотеки, і гроші, завдяки яким сканування поставлено на потік. Інформаційному гігантові не перешкоджають навіть судові процеси. Якщо хтось вважає, що авторські права порушені, і подає скаргу, компанія просто видаляє спірну книгу з сервера.


Ілля Яковлєв
www.