Историко-документальный просветительский портал создан при поддержке фонда «История Отечества»

Научно-практическая конференция «Приоритизация оцифровки архивных документов»

8 июня 2023 года в Российском государственном социальном университете стартовала Всероссийская научно-практическая конференция «Приоритизация оцифровки архивных документов для образовательных, научных и иных социальных целей».

Дискуссия, проходящая при поддержке фонда «История Отечества», посвящена вопросу внедрения возможностей искусственного интеллекта в архивную отрасль и научные исследования.

Оцифровка документов Архивного фонда Российской Федерации и других архивных документов, которая ведётся уже несколько лет, даёт исследователям и посетителям архивов несколько неоспоримых преимуществ — это и возможность легко получить доступ к интересующему документу, и обеспечение его сохранности, и возможность высвобождения архивных площадей.


С приветственным словом к участникам мероприятия обратился ректор Российского государственного социального университета, академик РАХ Андрей Хазин. Он отметил, что идея проведения конференции принадлежит Российскому историческому обществу, и сообщил, что оцифровка документов открывает много возможностей и позволяет по-новому взглянуть на историю России.

«Уверен, результаты сегодняшней конференции будут способствовать решению масштабной задачи по сохранению богатейшего исторического и духовного наследия нашей многонациональной страны. Искренне желаю всем участникам конференции яркой плодотворной работы, творческих успехов и новых решений во благо нашего Отечества. В добрый путь»,

— заключил он.

Также участников конференции поприветствовал заместитель Министра науки и высшего образования, член Президиума Российского исторического общества Константин Могилевский, обративший внимание на роль искусственного интеллекта в процессе обработки архивных документов:

«Не бывает исторической науки без использования архивных документов. Говоря об исторической науке, говоря об источниках исторического знания, мы, конечно, говорим об архивах, думаем о совершенствовании архивного дела. В этой связи, учитывая очень быстрые изменения, которые происходят в мире, в котором мы живём, в мире, который очень быстро становится цифровым, нельзя обойти вниманием и вопросы оцифровки архивных документов».

Он отметил, что одной из важнейших задач, стоящих перед архивным и историческим сообществом, является необходимость определить, что такое оцифровка архивных документов.

Оцифровка является комплексным и трудоёмким процессом. Перед началом непосредственного сканирования документов специалисты проводят экспертизу, определяют структуру исследуемого архивного фонда, качественные и количественные характеристики документов, выбирают технологию и оборудование для сканирования. На следующем этапе производится создание графических образов документов с помощью сканеров, результатом которого являются электронные копии документов, которые затем каталогизируются и записываются на носители информации. Ключевая стадия оцифровки — распознавание текста документов, позволяющее при дальнейшей работе с архивными фондами легко находить и изучать интересующий источник. Наиболее эффективно расшифровывают документы программы, основанные на технологиях искусственного интеллекта.


«Сегодня совершенно понятно, что искусственный интеллект с быстрой и пугающей скоростью входит в нашу жизнь. Понятно, что оцифровка в современном понимании никак не может исключать вопросы искусственного интеллекта. На мой взгляд, мы стоим на пороге больших перемен, связанных с возможностью анализа большого количества данных. Они касаются не только упрощения физического доступа к архивным документам, но и обработки архивных документов при помощи искусственного интеллекта»,

— подчеркнул Константин Могилевский.

В свою очередь, ВРИО председателя Правления Российского исторического общества Руслан Гагкуев отметил, что предстоит большая работа по выработке инструментария, который позволит наилучшим образом реализовать оцифровку архивных документов, и рассказал о трёх уже работающих проектах по оцифровке архивных документов.

«Для Российского исторического общества оцифровка архивных источников — одно из приоритетных направлений работы. По мнению многих экспертов РИО, оцифровка на нынешнем этапе может заключаться в двух этапах: это сканирование, которое сейчас ведётся в федеральных и региональных архивах. Второй этап, о котором сейчас говорил Константин Ильич, — это использование современных технологий для распознавания текста. Здесь предстоит большая работа»,

— отметил он.


На фото: Руслан Гагкуев

Одним из проектов в области оцифровки архивных документов с применением искусственного интеллекта является «Digital Пётр» — разработанный в преддверии 350-летия со дня рождения Петра I РИО, фондом «История Отечества» и Сбером проект, который позволяет за несколько секунд получить в удобном и понятном формате расшифровку рукописей Петра Первого. С помощью технологии глубокого обучения на основе девяти тысяч строк петровских текстов разных лет авторы проекта адаптировали параметры нейронной сети под конкретную задачу распознавания почерка императора. Благодаря технологиям компьютерного зрения, обработки естественного языка и графы знаний разработчикам проекта удалось добиться качества расшифровки в 97 %, при этом время распознавания составляет 35 страниц в минуту, тогда как у историков на расшифровку каждой страницы столь сложного почерка уходит по несколько часов.

Работа по цифровизации письменного наследия с помощью искусственного интеллекта ведётся во многих регионах России. Одна из подобных инициатив — проект Центра восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии СО РАН. В 2021 году Сибирское отделение РАН, Новосибирский государственный университет и Центр искусственного интеллекта МТС запустили пилотный проект по применению ИИ для распознавания тибетской письменности. С помощью глубокого обучения в ходе проекта удалось добиться точности распознавания отдельных тибетских символов в 94 %.

Над оцифровкой архивных документов работают и специалисты из Татарстана. В Центре письменного наследия Института языка, литературы и искусства Академии наук Республики Татарстан реализуется проект по цифровизации арабографичных письменных источников. Команда проекта разработала программу «Miras-Tat», позволяющую переводить старотатарские печатные источники сначала в арабицу, а потом в кириллицу. Сейчас результат машинного распознавания текстов достигает 75%. В перспективе программа может быть масштабирована и обучена работе с рукописным текстом, а также с арабографичными источниками на других тюркских языках


Пилотный проект по организации оцифровки документов Архивного фонда разработан и в Российском государственном социальном университете. О нём в ходе конференции рассказал заведующий кафедрой генеалогии и современной архивной работы РГСУ Александр Барков.

Напомним, оцифровке архивных документов и перспективам использования искусственного интеллекта в архивной отрасли был посвящён круглый стол «Цифровизация письменного наследия России: проблемы и перспективы», состоявшийся 22 марта 2023 года в Доме Российского исторического общества.

Текст: Диана Шакирова

Фото: Александр Шалгин

ВЕРСИЯ ДЛЯ СЛАБОВИДЯЩИХ

Поиск по сайту

Мы в соцсетях

Вестник №3/2024

КНИГИ

logo.edac595dbigsmall.png

Новости Региональных отделений

Белгородский государственный историко-краеведческий музей отметил своё 100-летие

Белгородский государственный историко-краеведческий музей отметил своё 100-летие

25 октября 2024 года 100-летие со дня создания отметил Белгородский государственный историко-краеведческий музей — коллективный член Российского исторического общества.

 

В Новосибирске подвели итоги конференции, посвящённой творчеству каменного века

В Новосибирске подвели итоги конференции, посвящённой творчеству каменного века

С 21 по 24 октября 2024 года в Институте археологии и этнографии Сибирского отделения Российской академии наук в Новосибирске работала всероссийская (с международным участием) научная конференция «Знаки и образы в искусстве каменного века», приуроченная 300-летию Российской академии наук.

 

В Курской области открылась выставка «Взгляд в прошлое: партийное строительство в 1924 г.»

В Курской области открылась выставка «Взгляд в прошлое: партийное строительство в 1924 г.»

25 октября 2024 года в Государственном архиве общественно-политической истории Курской области состоялось открытие выставки рассекреченных документов партийных органов Курской губернии «Взгляд в прошлое: партийное строительство в 1924 г.»

Прокрутить наверх