Трагедия библиотеки ИНИОН пробудила интерес общественности к оцифровке книг. Общественная палата, например, сочла нужным запросить ИНИОН — ну-ка, ответьте, как там у вас дела с оцифровкой? Члену палаты понадобилось это узнать, чтобы «поставить вопрос» об оцифровке «редких, единичных и тому подобных изданий».
В том же, в сущности, духе высказывается, негодуя, в соцсетях просвещённый обыватель: что ж не оцифровали библиотеку ИОНИОН, а? Обыватель винит в этом, разумеется, саму библиотеку. Среди наиболее продвинутых завсегдатаев соцсетей укоренилось мнение, что библиотеки вообще не нужны, а надо все книги оцифровать, после чего библиотеки закрыть. Будто сканером можно заменить библиотечное дело.
Между тем сразу после пожара стало известно, что в библиотеке ИНИОН оцифровано семь тысяч книг из без малого 15 миллионов единиц хранения, и сделано это вне связи с проектом создания Национальной электронной библиотеки (НЭБ), а в рамках программы «Научное наследие России».
Самая сканирующая нация в мире
У IT-специалистов есть термин «лоскутная автоматизация». Это вполне рабочее определение подхода, при котором каждое подразделение автоматизируемой организации вправе делать собственные IT-системы. Результаты лоскутной автоматизации – это, в частности, сайты наших ведомств и регионов. Все они делали всё сами, получилось неодинаково, однако худо-бедно работает, и где-то образуется даже передовой опыт, глядишь, его со временем распространят. Примерно так Курчатов проектировал, если верить легенде, территорию института – пусть сначала сотрудники протопчут тропинки, тогда мы их и заасфальтируем.
С книгами так нельзя. Одно и то же издание хранится в десятках, сотнях и тысячах наших библиотек. Оцифровывать эти издания в каждой из них – несусветная глупость, необходимо централизовать и скоординировать эту работу, распределить её, но исключив ситуацию, когда одну и ту же книгу сканируют более одного раза.
Как раз этого и не сделано. Библиотеки сканируют свои книжки самостоятельно. Никто не знает, что в стране оцифровано и сколько раз, а что – нет. Сколько какими библиотеками куплено сканеров и каких, известно тоже едва ли.
Беда ещё в том, что 120 тысяч российских библиотек принадлежат разным ведомствам. Например, ГПНТБ, крупнейшая техническая библиотека страны, находится в ведении Минобра. По данным D-Russia.ru, в 2014 году из выделенных на проект создания на НЭБ средств ГПНТБ получила приблизительно 0,1%. Непонятно, каким образом в проекте создания НЭБ участвует библиотека РАН с её уникальным фондом.
Нет официально принятого технического решения – в каком формате хранить электронные книги. Сейчас книги для чтения в НЭБ лежат в PDF, но не как текст, а картинками, и «весит» книжка десятки (часто – многие десятки) мегабайт, что для хранения книг в мобильных устройствах неприемлемо. О распознавании текстов при сканировании речь вообще не идёт, хотя российские OCR-технологии – лучшие в мире.
И ещё – никто до сих пор не догадался остановить процесс микрофильмирования книг, т.е. их аналогового фотографирования. Микрофильмированиеу нас до сих пор продолжается с 60-х годов прошлого века как ни в чём ни бывало, одновременно со сканированием.
Национальное электронное б.
То, что количество оцифрованных книг в НЭБ неизвестно, могут оспорить: ведь на стартовой странице НЭБ.РФ сказано, сколько книг оцифровано, зайди и посмотри. Действительно, заходим и видим – оцифрованы 1 671 878 «электронных книг» (и цифра эта день от дня не меняется).
Давайте посмотрим, что это за книги. Может быть, есть каталог, где лежат ссылки на оцифрованное? Такой, как у Максима Мошкова в Lib.ru. Но нет, не видно каталога. Может, надо зарегистрироваться в библиотеке, тогда и к каталогу подпустят? Странно, если так, почему бы всем не показать, что есть в НЭБ. Но мало ли что у разработчиков в голове, давайте зарегистрируемся.
Регистрация в НЭБ представляет собой первую стадию издевательств над читателями. Не буду описывать подробно безобразие, которое у НЭБ находится на месте пользовательского интерфейса. Скажу только, что регистрация по номеру читательского билета РГБ – фикция, и что учётная запись в ЕСИА (Единая система идентификации и аутентификации) вам не поможет. При «полной регистрации» (чем она отличается от «упрощенной», нам не говорят, но ничего, сами догадываемся) мало вписать номер паспорта, надо еще и загрузить его скан. Это чтобы книжку почитать!
Я от загрузки скана паспорта воздержался, что и вам советую, иначе ваши персональные данные гарантированно попадут в руки жуликов. Они не боятся премьер-министра перед камерами обманывать, два месяца назад продемонстрировали ему якобы работающий сайт НЭБ, где идентификация пользователя через ЕСИА была не сделана, а нахально имитирована. Этак и кредит на чужое имя оформить могут.
«Упрощенная» регистрация неопасна, но толку-то от неё. Каталога оцифрованной литературы нет и для зарегистрированных. Всё, что вы можете – это поискать книжку, скажем, «Мёртвые души». А почитать – как повезёт.
Читатели НЭБ не нужны
Людям от НЭБ прежде всего нужны тексты – хотя бы тех книг, которые не защищены копирайтом. Чтобы почитать. Желательно epub или fb2 (формат этот, кстати сказать, разработан в России), чтобы можно было загрузить книжку в мобильное устройство.
Вы полагаете, в НЭБ можно найти и прочесть, например, текст «Мёртвых душ»? Как бы не так.
Гоголь справился бы с описанием того, что вы увидите при поиске, а я не берусь. Чёрт знает, что вы увидите. Кучу более или менее бессмысленных ссылок, но только не саму книгу. За ней – к Мошкову.
Чтобы найти чтиво, надо ходить по ссылкам на библиотеки, и искать в тамошних каталогах кнопку «Читать» напротив записи о единице хранения. Если такая кнопка есть – повезло, можно попытаться прочесть или скачать книжку. Будет неудобно, т.к. полноэкранный режим хотя и обещан, но не работает, а скачать файл, как это обещано соответствующей ссылкой, можно тоже не всегда.
Точки входа в оцифрованный фонд нет, и это не позволяет пользоваться НЭБ. Может, так сделали нарочно? Даже если про 1,7 миллиона оцифрованных книг (среди которых я «Мёртвых душ» так и не нашел) сайт НЭБ говорит правду (которую не проверишь), – это, вероятно, главным образом и не книги вовсе, а диссертации, которые хранятся в РГБ и оцифрованы давным-давно. Гипотезу легко будет проверить, когда (и если) в НЭБ появится каталог для работы с цифровыми фондами.
Попытка связаться с электронными библиотекарями ничего не даёт. В ответ на вопрос «как прочесть Пушкина (с ним та же история, что и с Гоголем – ред.), если на сайте НЭБ есть только библиографические данные издания, но нет ссылок на сами тексты» спустя всего-то восемь дней отвечают: «Фонд НЭБ состоит не только из полнотекстовых изданий, но и из библиографических записей. Скорее всего, Вы нашли именно такие записи. Пришлите, пожалуйста, ссылку на соответствующую страницу, чтобы мы могли точно ответить на Ваш вопрос». И предлагают «сделать заказ на оцифровку».
Это странно, но не страшно, Гоголя с Пушкиным в Сети и без НЭБ найти не проблема. Страшно другое — то, что НЭБ не исполняет предназначение библиотеки как хранилища знаний, места, где знания передаются будущим поколениям.
Энтузиасты, наполнившие библиотеку Мошкова, не могут оцифровать уникальные и потому особо ценные издания – такие, которые есть только в библиотеках, и иной раз в единственном экземпляре. Именно такие издания во множестве хранились в ИНИОН, и нам только предстоит узнать, сколько из них утрачено.
Сканируют ли уникальные издания для НЭБ? Да, но – лоскутно, по инициативе самих библиотек, без системы, без плана и без учёта сканированных уникальных изданий. Сколько их оцифровано – неизвестно, и на сайте НЭБ никаких сведений об этом нет.
Что общего у АНБ США и Минкультуры РФ
Сколько бы Сноуден ни разоблачал АНБ, американских шпионов не уволили. Публика будто бы не против слежки за собой, в русскоязычных соцсетях никаких признаков негодования на сей счёт. ИНИОН негодование вызывает, потому что книжки до пожара не оцифровал, а АНБ – нет.
Возможно, это защитная реакция массового сознания на разрушающие привычную картину мира сведения. Нельзя же, в самом деле, принять, что американцы с англичанами, приличные с виду люди, принялись ломать сеть производителя SIM-карт не для того, чтобы спасти мир, а чтобы его подслушивать.
С Минкультуры, которое курирует проект НЭБ, та же история, что и с АНБ. Сколько ни соверши Минкультуры надругательств над случайными посетителями НЭБ.РФ и над здравым смыслом – ничего страшного, всё сходит с рук.
Ладно неоцифрованные книжки и неработающий сайт. Сорвано исполнение ФЦП «Культура России (2012-2018 гг.)» в весьма важной ее части. Бюрократическая машина должна была бы провернуть предназначенные на этот случай шестерёнки и бездумно покарать ответственного, но нет – не происходит ничего.
В мае 2012 года президентским указом №597 предписано включать ежегодно в НЭБ не менее 10% издаваемых в РФ книг (по наименованиям). Проверить исполнение невозможно, потому что невозможно найти эти книги в НЭБ. Минкультуры отчитывается о выполнении своеобразно – в 2013 году, например, планировалось оцифровать более пяти миллионов страниц. Сколько это будет в книгах и процентах, никто не знает.
Что такое НЭБ – не технически, а организационно? Есть ли у НЭБ юридическое лицо? Кто отвечает за проект? Какие работы ведутся, во что они обходятся бюджету? Концепция НЭБ появилась только в ноябре прошлого года (подписал документ заместитель министра культуры Григорий Иевлев), но юридической силы не имеет – она не согласована ни Минобром, ни Минсвязью.
Иными словами, Минкультуры за два года не утвердило должным образом никаких нормативных документов, регламентирующих процесс создания НЭБ. Как следствие, об оцифрованных электронных фондах библиотеки ИНИОН – как и других российских библиотек – ничего не известно, чтобы выяснить это, надо предпринимать расследование.
Особо надо сказать о деньгах. НЭБ, IT-проект федерального уровня, имеющий важнейшее значение для будущего страны, пребывает в непонятном статусе, тем не менее, сотни миллионов рублей уже истрачены, и отчитаться за них НЭБ нечем. Можно говорить о нецелевом расходовании средств на том формальном основании, что те самые 1,7 миллиона оцифрованных книг находится в собственности не НЭБ, а РГБ.
С каталогом все просто. В библиотеках применяются несколько разных каталогов, называются они навигаторами. Типа УДК-навигатор, ББК-навигатор и т.п.
Когда книга описывается, ей присваевается номер в какой навигатор она попадает. Почему хоть один из навигаторов не применяется в НЭБ, хотя он наверняка есть в описании к книгам — непонятно. Но в некотором смысле все эти навигаторы устарели т.к. они ориентированны больше на потребности библиотекарей, чем пользователей.
Еще для навигации в библиотеках используются «коллекции». По сути своей коллекции — это подборка книг. Коллекции в НЭБ есть, но они плоские, как теги, т.е. не создают иерархию и коллекции в НЭБ создаются библиотеками, т.е. их нельзя считать глобальным средством навигации.
Создания приличного средства навигации не на основе одного из навигатора крайне трудозатратно из-за распределенной архитектуры НЭБ.
Теперь по форматам: формат там действительно только PDF и связано это с тем, что почти весь фонд там — сканы книг. Почему нет мобильного формата — это «косяк» исключительно составителей ТЗ на НЭБ, т.е. минкульта.
Распознавание там наверняка есть, если говорить про документацию РГБ, то к книге должна быть невидимая подложка из распознанного текста.
FB2 — плохой формат, не надо его использовать прежде всего потому — что он локальный формат. За пределами эксСССР практически не встречается. EPUB будет предпочтительнее.