За рубежами

Американский исследователь выложил в открытый доступ миллионы книжных иллюстраций

01.09.2014

2058

Американский исследователь Калев Литару (Kalev Leetaru) создает базу данных книжных иллюстраций, которые может бесплатно использовать любой желающий. На сегодняшний день он уже разместил на фотохостинге Flickr более 2,6 миллиона изображений, в планах — довести коллекцию до 12 миллионов файлов, сообщает Би-би-си.

Фотографии и рисунки взяты из книг, отсканированных в библиотеках организацией Internet Archive. Все они публиковались с 1500 до 1922 года, то есть до времени, с которого начинаются ограничения в связи с авторскими правами.

Общее число отсканированных страниц превышает 600 миллионов. Для того, чтобы извлечь из них изображения Литару разработал программу, которая делает это автоматически и сама проставляет тэги, по которым затем можно искать картинки. Для каждого рисунка указывается название книги, откуда он извлечен, и приводятся фрагменты текста до и после иллюстрации. Также среди данных — дата публикации, имена авторов издания, издателей, при возможности — художника или фотографа. Можно посмотреть данные о книге, познакомиться с ее текстом, вывести на экран все изображения из данного тома.

Подобная база изображений создается впервые. До сих пор все оцифрованные книги рассматривались с точки зрения массива текста, по которому и предполагался поиск. Иллюстрации оставались «за кадром».

По словам Литару, большинство иллюстраций, сохранившихся в книгах, уже не найти ни в одной галерее в мире, поскольку оригиналы давно утрачены.

Кроме прикладной пользы от базы данных изображений, Литару видит в своем проекте поле деятельности для социологов, историков, маркетологов и так далее. По его мнению, наблюдая за эволюцией рисунков, можно узнать детали развития общества. Например, если набрать в поиске слово «телефон», можно заметить, что на первых картинках изображены бизнесмены (преимущественно мужчины), но постепенно он начинает позиционироваться как устройство для общения с близкими.

Еще Литару хочет «скрестить» свою базу с Wikipedia, чтобы картинки автоматически подгружались к соответствующим статьям энциклопедии. Также он собирается предоставить исходный код своей программы для пользования всем желающим. «Я очень надеюсь, что библиотеки по всему миру воспользуются подобным процессом для своих оцифрованных книг, чтобы неуклонно расширять эту вселенную изображений», — заявил он.

Фото (с) Калев Литару

Чтобы не пропустить самое интересное, читайте нас в Max и Телеграм