Цифровые книги: опыт Британской библиотеки
Статья обобщает опыт оцифровки библиотечных фондов в Великобритании, представляющий интерес в связи с проектом создания Национальной электронной библиотеки России. При подготовке материала использована, в частности, работа К. Бразье «Возможности и проблемы формирования фонда цифровых материалов: опыт Британской библиотеки», опубликованная в журнале «Научные и технические библиотеки», 2014, №6.
Юридические и политические аспекты, влияющие на формирование фондов в Британской библиотеке
«После десятилетнего периода исследований, обсуждений с представителями издательской индустрии и переговоров с правительством Закон об обязательном экземпляре для депозитарных библиотек (Legal Deposit Libraries Act) был одобрен правительством в 2003 году. В этом законе устанавливались общие базовые принципы сбора электронных материалов в целях депонирования, однако потребовалась значительная дальнейшая проработка детального регулирования соответствующих процессов – со стороны как библиотек, так и издателей.
Правила регулирования поступления обязательного экземпляра нетрадиционных (непечатных) документов были окончательно подготовлены и вступили в силу 6 апреля 2013 года, что дало возможность шести депозитарным библиотекам Великобритании и Ирландии (Вritish Library, Bodleian Library, Cambridge University Library, National Library of Scotland, National Library of Wales, Trinity College Library) начать работу по широкомасштабному комплектованию электронных материалов и, что особенно важно, – приступить к сбору и архивированию сайтов сетевого домена Великобритании».
В этом процессе библиотечное сообщество представлял консорциум из 33 научных библиотек Великобритании RLUK (Research Libraries UK).
Ключевым моментом в достижении договоренностей сторон стал «Доклад г-жи Финч» (Accessibility, sustainability, excellence: how to expand access to research publications. Report of the Working Groupon Expanding Access to Published Research Findings), в котором были обобщены и проанализированы предложения по новым моделям открытого доступа (ОД).
Последний этап работы над правилами представлен ниже:
«В течение последнего десятилетия мы являемся свидетелями и кампании по юридическому оформлению депонирования электронных документов, и международных усилий по улучшению широкого публичного доступа к результатам научных исследований, выполненных за государственный счёт».
В ЕС в рамках флагманской инициативы «Innovation Union» стратегии Europe 2020 реализуются проекты, отобранные Европейским стратегическим форумом по научно-исследовательской инфраструктуре ESFRI, ведущего органа ЕС, осуществляющего предварительный отбор и последующую координацию проектов категории megascience, которые финансируется через «Horizon 2020».
В формируемой «дорожной карте» на 2016 год предлагается проект:
«Кроме того, сейчас мы наблюдаем «встречную волну», причём Всемирная организация интеллектуальной собственности (World Intellectual Property Organisation) рассматривает проекты международных соглашений, которые удобны для работы как библиотек, так и учёных, и новые законы, облегчающие проведение массовой оцифровки и использование так называемых сиротских произведений в Европе».
В период с 2011 по 2013 годы были утверждены новые стратегии развития Британской библиотеки.
В стратегиях «Взгляд в 2020» и «Стратегия Британской библиотеки 2011-2015» обозначены приоритеты развития:
В «Стратегии цифрового хранения Британской библиотеки 2013-2016», в частности, приводится схема управления цифровыми коллекциями (digital collections).
В составе Руководящей группы управления коллекциями (Collection Management Steering Group), которую возглавляет директор коллекций Британской библиотеки (в настоящее время им является Кэролайн Бразье – автор публикации), появился Глава цифрового сохранения (Headof Digital Preservation), который руководит Командой цифрового сохранения (Digital Preservation Team) – научно-исследовательским подразделением, которое определяет инструменты, практики и политики цифровой сохранности:
где — Integrated Risk Management (IRM); Corporate Procurement Unit (CPU); Strategic Partnerships & Licensing (SPL); Architecture & Development (A&D).
В стратегию также включены рекомендации по расчёту стоимости жизненного цикла долговременного сохранения цифровой информации, базирующиеся на результатах проекта LIFE (Life Cycle Information for E-Literature).
Исследования показали, что стоимость хранения в специализированных хранилищах, совместимых со стандартом OAIS, по сравнению с обычным файловым хранением, уменьшается в 2-3 раза за первые 1-2 года и в 15-16 раз в течение 5 лет. Около 50% затрат, связанных с технологическим циклом сохранения цифровых объектов, приходится на создание метаданных. Поэтому в рамках различных проектов разрабатываются системы автоматического или полуавтоматического приписывания метаданных, необходимых для обеспечения сохранности.
В контент-стратегии «От сохранённого знания к умному знанию. Стратегия Британской библиотеки по формированию фондов на период 2013–2015 гг.» пересмотрены принципы, на которых базируется политика формирования фондов в последнее десятилетие, в том числе работы по селекции документов.
Принципы формирования цифровых фондов
Британская библиотека была образована в 1973 г. и в первые несколько лет включила в свой состав: 1) Библиотеку Британского музея и входящую в её структуру Национальную реферативную библиотеку науки и изобретений (NRLSI), 2) Национальную центральную библиотеку (NCL), 3) Национальную библиотеку науки и технологий (NLLST), 4) Ведомство по проблемам научной и технической информации (OSTI), 5) Британскую национальную библиографию (BNB), 6) Библиотеку звуковых записей и 7) Британский институт аудиозаписи.
«В процессе селекции печатных и электронных материалов мы фокусируемся:
на трёх тематических направлениях: | на сборе определённых видов материалов: |
— искусство и гуманитарные науки (Arts and Humanities);- наука, технологияимедицина (Science, Technology and Medicine);- общественныенауки (Social Sciences); | — за комплектование которых мы несёмответственность в национальном масштабе (например газеты, звукозаписи);- или те, где наши коллекции занимают видное место среди мировых библиотек (карты, рукописи). |
Определение понятия «национальный»
«Интернет имеет глобальный характер, и электронные документы «не уважают» национальные границы – большинство из них свободно «путешествует» по миру.
В рамках недавно принятых в Великобритании правил, сетевое издание считается «опубликованным в Великобритании», если:
- документ доступен на сайте с доменным именем, имеющим отношение к Великобритании или к какому-то месту в Великобритании,
- доступность документа обеспечена лицом, чья работа по созданию произведения или его опубликованию была произведена в Великобритании.
Это означает, что при формировании национальной коллекции идентификация места на основании доменных имен становится всё более важной. Во многих других случаях только посредством переговоров библиотеки с издателем можно установить, где именно была создана существенная часть произведения».
«Национальные библиотеки ведут комплектование для того, чтобы обеспечить доступ к национальной памяти как нынешним, так и будущим поколениям.
Но природа цифровой информации и электронных материалов подразумевает, что их можно «собирать» самыми различными способами. Например, кроме переноса материалов на библиотечные серверы, мы также можем предоставлять связь с информационными ресурсами и публикациями, получив предварительно права доступа по лицензиям, членству в каких-либо сообществах или по соглашениям о партнёрстве.
Связь с документом становится столь же значимой, как и его приобретение. И во всё большей степени выработка рекомендаций к конкретным массивам ресурсов ОД и формирование связей к ним становятся важной частью процесса формирования фондов – такой же важной, как и процесс селекции в эпоху печатных документов.
Всё растущее число издателей и библиотек активно участвуют в системах обеспечениясохранности электронных документов, таких как Portico (www.portico.org) или CLOCKSS (www.clockss.org). Однако до сих пор не существует системной гарантии полноценного комплектования и обеспечения сохранности, которые бы совместно работали по интегрированной схеме и гарантировали бы доступ для будущих поколений.
В цифровую эпоху каждая национальная библиотека имеет возможность не только организовать и поддерживать формирование национальных фондов в своей стране, но и играть существенную роль в гарантировании долговременной международной доступности за счёт совместного формирования распределённых фондов и обслуживания ими. В рамках международного сотрудничества мы предполагаем пересмотреть принципы Универсального библиографического учёта – UBC (Universal Bibliographic Control) и Всеобщей доступности публикаций – UAP (Universal Availability of Publications) применительно к цифровой эпохе».
В Британской библиотеке сформировано более 600 электронных коллекций. Они формируются на базе фондов электронных материалов, которые комплектуются из публикаций коммерческих издательств, «изначально цифровых» документов и материалов цифрового наследия.
Комплектование электронных публикаций научных изданий
«Британская библиотека традиционно расходует заметную часть (около 20%) своего бюджета на приобретение научных публикаций – в основном международных академических журналов и монографий – для пополнения библиотечного фонда сверх того, что поступает по Закону об обязательном депонировании. Можно считать, что электронные документы создают предпосылки для более радикальных подходов, если мы можем гарантировать британским учёным доступ к источникам в любое удобное для них время.
Интересный момент в формировании цифровых фондов – это определение роли национальной библиотеки в сборе и обеспечении сохранности растущего объёма научных статей и иных материалов, публикуемых по различным каналам открытого доступа (ОД)».
Рост числа научных публикаций ОД по результатам исследований, выполненных за государственный счёт, можно считать кульминацией и текущего десятилетия.
На практике многочисленные модели систем публикаций материалов в ОД существенно осложняют работу. Не имея согласованных систем метаданных и соглашений с «владельцами» каналов ОД (в том числе с издателями коммерческих электронных журналов, журналов ОД, институциональных и тематических репозитариев), технически и функционально очень сложно наладить сервисы по агрегированному обнаружению, сбору и обеспечению сохранности документов.
[box]Справка:
В мае 2014 года сообщество научных библиотек Великобритании RLUK и Европейская библиотека начали информационно-просветительскую кампанию, цель которой — популяризация использования связанных открытых данных среди европейских библиотек (RLUK Linked Open Data Hackathon). В 2010 году Британская библиотека опубликовала методом связанных данных Британскую национальную библиографию (БНБ), а годом позже запустила систему поиска по ней, понимающую прямые текстовые запросы. Тип структуризации данных БНБ стал популярным в библиотечном сообществе, сделав возможной практическую реализацию теории связанных данных.[/box]
Комплектование электронных публикаций коммерческих издательств
«Мы решили сломать традиционные барьеры и принять более интегрированный подход к новостям во всех форматах – печатному, радио- и сетевому вещанию. Новый подход означает модернизацию политики формирования фондов, которая теперь отражает всё многообразие и способов поиска информации, и запросов пользователей.
Помимо пересмотра нашей политики комплектования современных коммерческих изданий, мы также должны разобраться с проблемой доступа к ретроспективным коммерческим публикациям. Массовая оцифровка ретроспективных выпусков журналов, газет и подобного рода документов, выполненная издателями, медийными компаниями и другими организациями, порождает новые способы доступа к ретроспективным коллекциям».
Комплектование изначально электронных материалов
Британская библиотека по поручению депонирующих библиотек начала формировать цифровой архив. В него войдут все интернет-страницы национального сектора Сети, а также все выпущенные в Великобритании электронные журналы, газеты и книги.
Формирование архива будет выполнено в соответствии с требованиями вступившего в силу Закона об обязательных экземплярах. Архив создается с помощью специального программного обеспечения, которое все страницы британской зоны Интернета сбрасывает на особые серверы. Сначала программы обрабатывают доменную зону .uk, которая включает порядка 5 миллионов сайтов или около 1 миллиарда страниц. После этого программы просматривают зоны .com и .org, которые состоят из 3-4 миллионов сайтов.
Кроме того в архив все издатели электронных экземпляров обязаны предоставлять бесплатно все электронные версии книг, газет и журналов. Также в архив будет включена информация с выпускаемых на территории Великобритании DVD-дисков.
Собранная информация будет храниться на четырех серверах. Бумажные варианты изданий продолжат хранить, используя «архивные мобильные стеллажи». В будущем они также будут оцифрованы.
Комплектование электронных материалов культурного и научного наследия
«В прошедшем десятилетии главной проблемой была оцифровка коллекций редких или уникальных изданий, относящиеся к культурному наследию, которая повысила их доступность.
Но сейчас зачастую национальным библиотекам приходится к документам культурного наследия добавлять изначально электронные материалы, что ставит определённые проблемы.
Например, в коллекциях карт происходит замещение физических карт цифровыми, что, с одной стороны, создаёт сложности в работе, но с другой – открывает новые возможности для исследований – учёные могут улучшать коллекции.
Личные архивы выдающихся людей в любой области всегда были гвоздём специальных коллекций библиотек. Поэтому мы собираем: электронную почту поэтов – вместо их писем, личные электронные мемуары политиков – вместо их письменных дневников, и кроме того, личные веб-сайты, блоги, твиты и многочисленные сообщения в соцсетях».
Технические проблемы обеспечения сохранности документов, стоящие перед личными архивами, сейчас только начинают проявляться.
«Основные технические вопросы: нам следует быть готовыми собирать новые типы документов, быстро реагировать на появление новых каналов коммуникации или новых устройств. Поскольку они появляются относительно быстро, а содержащиеся в них документы – непрочные, «летучие», то к их комплектованию нужно приступать незамедлительно, т.е. совсем не так, как это было в «аналоговом мире». Без соответствующего реагирования электронные документы, достойные быть включёнными в национальный фонд, могут исчезнуть либо измениться».
Ещё один вопрос – право собственности на многие массивы электронных документов чётко не обозначено.
Цифровые кураторы
Быстрый прогресс в использовании цифровых технологий оказывает влияние на работу библиотек.
В Британской библиотеке создана небольшая группа «цифровых кураторов» (digital curators), задача которой – планирование оперативного и долговременного цифрового сохранения; определение критериев отбора для долговременного сохранения; вопросы экономики сохранения и другое.
Помимо этого с цифровыми кураторами напрямую работают Лаборатории Британской библиотеки (BLLabs):
Программа BLLabs стартовала в 2012 году. Это инициатива фонда Andrew W. Mellon Foundation, который приглашает исследователей и разработчиков к работе с цифровыми коллекциями Британской библиотеки с целью реализации в них «лучших идей»:
К задачам цифровых кураторов также относится выработка рекомендаций по приобретению необходимых навыков библиотекарями. Такие рекомендации легли в основу соответствующей программы повышения квалификации (Digital Scholarship Training Programme), рассчитанной на два года и состоящей из 15 однодневных курсов, где изучаются базовые концепции, методики и инструменты для овладения современными электронными технологиями.
Вместо заключения
16 января 2015 года Британская библиотека представила стратегию развития до 2023 года — проект «Живое знание» (Living Knowledge: The British Library 2015 – 2023). «Открытая, созидательная, инновационная» — такой видится Британская библиотека в 2023 году – в год своего пятидесятилетия.
В ходе презентации стратегии генеральный директор Британской библиотеки Роли Китинг представил также проекты, которые планируется внедрить в библиотеке до 2023 года: отсканировать всю фонотеку, распространить коллекции во всем мире и построить исследовательский центр благодаря государственным инвестициям в 54,7 миллиона евро.
Он сказал, что «задача библиотек не конкурировать с новыми технологиями, но уметь адаптироваться к ним, чтобы извлекать пользу.»