Эволюция программного обеспечения для навигации в электронных книгах
Погорелко К.П.
(Отдел БЕН РАН в Математическом институте РАН)
При организации электронных библиотек, содержащих документы большого объема, такие как книги, возникает проблема их представления. Зачастую создатели библиотек не утруждают себя и представляют документы целиком в формате pdf или djv. Однако такой подход не всегда удобен для пользователя, т.к. для того, чтобы посмотреть несколько нужных страниц или решить, нужна ли вообще книга в данном представлении, ему приходится скачивать ее целиком. Некоторые электронные библиотеки как, например, издательство Шпрингер, размещают книги разбитыми на главы, каждая из которых доступна в формате pdf.
При организации электронной библиотеки Математического института им. В.А. Стеклова РАН (отдел БЕН РАН в Математическом институте) было принято решение обеспечить возможность постраничного показа размещаемых публикаций. Такой подход сильно экономит сетевой трафик, т.к. помимо того, что пользователь имеет возможность посмотреть только интересующие его страницы, изображения страниц передаются пользователю не в разрешении сканирования (600 точек на дюйм), а пересчитанными на тот размер, который удобен для просмотра на экране (обычно 100 точек на дюйм, т.е. размер файла сокращается в 36 раз).
Организация электронной библиотеки с возможностью постраничного показа требует реализации эффективной навигации по тексту документа, особенно когда документ имеет большой объем. Для навигации по тексту документа в первой реализации электронной библиотеки МИАН создавалось иерархическое текстовое оглавление. Программное обеспечение (ПО) для создания текстовых оглавлений описывалось в [1] и [2].
При организации электронной библиотеки «Научное наследие России» (далее ЭБ) для представления документов было принято решение об обеспечении возможности постраничного просмотра. Для обеспечения навигации было решено использовать технологии, применявшиеся в электронной библиотеке МИАН. При адаптации программного обеспечения для нужд ЭБ был проведен ряд модификаций. Технологический процесс подготовки материалов для ЭБ отличается от технологического процесса, принятого в МИАН, поэтому первой задачей было уточнение и формализация технологического процесса ЭБ. Соответственно, одной из задач модификации ПО было обеспечение программными средствами этого технологического процесса.
Основным идентификатором документа в ЭБ является так называемый «номер МСЦ», который присваивается документу при принятии решения о включении документа в Библиотеку. Загрузка документа в систему и дальнейшая работа с документом невозможна без предъявления этого идентификатора.
В подготовке документов для ЭБ участвует много организаций. Исполнители в процессе ввода выполняют различные операции. Соответственно, в ПО было введено понятие «роль». Роль того или иного исполнителя определяется администратором системы. После проверки его полномочий исполнитель имеет доступ только к тем документам и на выполнение тех операций, которые определены его ролью. В системе предусмотрены следующие роли: оператор ввода оглавлений, руководитель группы, выпускающий редактор. Оператор ввода оглавлений осуществляет загрузку изображений документа на сервер и снабжает документ текстовым оглавлением. Руководитель группы представляет организацию, входящую в проект. Он имеет доступ ко всем документам, вводимым операторами его группы. Задача руководителя группы – выходной контроль за вводимыми документами, представляемыми организацией. Выпускающий редактор представляет интересы администрации электронной библиотеки и осуществляет окончательный контроль документов. Публикация документов в Интернет осуществляется только с его ведома.
Другое направление модернизации ПО касалось обеспечения больших возможностей для манипулирования с изображениями. Для обеспечения коррекции загруженных на сервер изображений были добавлены возможности замены изображений, удаления изображений и вставки пропущенных изображений. При всех манипуляциях ссылки в оглавлении на соответствующие номера изображений пересчитываются. Таким образом, навигация по оглавлению остается корректной.
Опыт формирования электронных библиотек как МИАН, так и «Научное наследие России» подтвердил удобство и эффективность применяемого метода навигации для большинства публикаций. Однако в ходе работ по вводу документов выявились проблемы при организации текстовых оглавлений для некоторых книг. К таким книгам относятся книги на редких языках и книги, содержащие в оглавлении специальные шрифты, знаки и формулы. Например, набор оглавлений на латыни или немецком языках, представленных готическим шрифтом, для операторов этими языками не владеющих, является очень трудоемким, а порой –невозможным. Для книг, содержащих в оглавлении формулы, например, математические, можно использовать какой-либо язык, обеспечивающий представление формул. Для математической литературы это мог бы быть Тех или Mathml. Но использование этих языков требует, с одной стороны, реализации их интерпретации и представления формул в удобочитаемом виде в подсистеме представления документов пользователю. С другой стороны, это предъявляет повышенные требования к квалификации оператора на вводе оглавления, т.к. оператор должен этими языками владеть.
Для решения этой проблемы в ЭБ МИАН в настоящее время реализован подход, при котором для навигации по электронной книге используется существующее в этой книге оглавление. На этапе подготовки документа к публикации после его загрузки на сервер оператор выбирает изображения, являющиеся оглавлением, содержащимся в книге. Это может быть одно или несколько изображений. Далее оператор на изображениях оглавления определяет регионы, относящиеся к тем или иным разделам книги. Для каждого региона определяются начальное и конечное изображения страниц. Начальные номера используются в дальнейшем для навигации, а конечные нужны для обеспечения возможности генерации pdf файлов для выбранных разделов книги. Отмеченные регионы отображаются на изображении оглавления, так что оператор видит, какие части оглавления обработаны, а какие нет. Текущий регион подсвечивается. После завершения процедуры разметки проводится ряд проверок. Прежде всего требуется, чтобы для всех отмеченных регионов были заданы начальное и конечное изображения. Далее проводится проверка, не перекрываются ли отмеченные регионы. Если регионы перекрываются, их границы можно поправить в ручном или автоматическом режиме. Оператор видит и, соответственно, размечает изображения в том разрешении, которое обеспечивает его экран, а не в разрешении, в котором хранятся изображения. Поэтому необходимо произвести пересчет параметров для соответствия характеристикам хранящихся изображений. Соответствующая информация о регионах и диапазонах, относящихся к ним изображений, запоминается на SQL сервере.
На этапе представления книги пользователю он видит перед собой два изображения. Одно – изображение текущей страницы. Другое – изображение одной из страниц оглавления. Также доступна командная панель, служащая для изменения масштабов видимых изображений, ручной навигации на следующую или предыдущую страницу, возможных поворотов изображения и заказа pdf файла. Изображение страницы оглавления передается пользователю снабженным HTML элементом MAP с элементами AREA, соответствующими размеченным для навигации регионам. Поскольку изображение передается пользователю в выбранном им разрешении, производится пересчет размеров регионов на эти параметры изображения.
При заказе pdf файла пользователю предлагается выбрать необходимый раздел книги. Выбор раздела осуществляется при помощи изображений оглавления. После того, как выбор сделан, на сервере формируется pdf файл из изображений, относящихся к выбранному разделу, и этот файл пересылается пользователю.
Литература