Историко-документальный просветительский портал создан при поддержке фонда «История Отечества»

Научно-практическая конференция «Приоритизация оцифровки архивных документов»

8 июня 2023 года в Российском государственном социальном университете стартовала Всероссийская научно-практическая конференция «Приоритизация оцифровки архивных документов для образовательных, научных и иных социальных целей».

Дискуссия, проходящая при поддержке фонда «История Отечества», посвящена вопросу внедрения возможностей искусственного интеллекта в архивную отрасль и научные исследования.

Оцифровка документов Архивного фонда Российской Федерации и других архивных документов, которая ведётся уже несколько лет, даёт исследователям и посетителям архивов несколько неоспоримых преимуществ — это и возможность легко получить доступ к интересующему документу, и обеспечение его сохранности, и возможность высвобождения архивных площадей.


С приветственным словом к участникам мероприятия обратился ректор Российского государственного социального университета, академик РАХ Андрей Хазин. Он отметил, что идея проведения конференции принадлежит Российскому историческому обществу, и сообщил, что оцифровка документов открывает много возможностей и позволяет по-новому взглянуть на историю России.

«Уверен, результаты сегодняшней конференции будут способствовать решению масштабной задачи по сохранению богатейшего исторического и духовного наследия нашей многонациональной страны. Искренне желаю всем участникам конференции яркой плодотворной работы, творческих успехов и новых решений во благо нашего Отечества. В добрый путь»,

— заключил он.

Также участников конференции поприветствовал заместитель Министра науки и высшего образования, член Президиума Российского исторического общества Константин Могилевский, обративший внимание на роль искусственного интеллекта в процессе обработки архивных документов:

«Не бывает исторической науки без использования архивных документов. Говоря об исторической науке, говоря об источниках исторического знания, мы, конечно, говорим об архивах, думаем о совершенствовании архивного дела. В этой связи, учитывая очень быстрые изменения, которые происходят в мире, в котором мы живём, в мире, который очень быстро становится цифровым, нельзя обойти вниманием и вопросы оцифровки архивных документов».

Он отметил, что одной из важнейших задач, стоящих перед архивным и историческим сообществом, является необходимость определить, что такое оцифровка архивных документов.

Оцифровка является комплексным и трудоёмким процессом. Перед началом непосредственного сканирования документов специалисты проводят экспертизу, определяют структуру исследуемого архивного фонда, качественные и количественные характеристики документов, выбирают технологию и оборудование для сканирования. На следующем этапе производится создание графических образов документов с помощью сканеров, результатом которого являются электронные копии документов, которые затем каталогизируются и записываются на носители информации. Ключевая стадия оцифровки — распознавание текста документов, позволяющее при дальнейшей работе с архивными фондами легко находить и изучать интересующий источник. Наиболее эффективно расшифровывают документы программы, основанные на технологиях искусственного интеллекта.


«Сегодня совершенно понятно, что искусственный интеллект с быстрой и пугающей скоростью входит в нашу жизнь. Понятно, что оцифровка в современном понимании никак не может исключать вопросы искусственного интеллекта. На мой взгляд, мы стоим на пороге больших перемен, связанных с возможностью анализа большого количества данных. Они касаются не только упрощения физического доступа к архивным документам, но и обработки архивных документов при помощи искусственного интеллекта»,

— подчеркнул Константин Могилевский.

В свою очередь, ВРИО председателя Правления Российского исторического общества Руслан Гагкуев отметил, что предстоит большая работа по выработке инструментария, который позволит наилучшим образом реализовать оцифровку архивных документов, и рассказал о трёх уже работающих проектах по оцифровке архивных документов.

«Для Российского исторического общества оцифровка архивных источников — одно из приоритетных направлений работы. По мнению многих экспертов РИО, оцифровка на нынешнем этапе может заключаться в двух этапах: это сканирование, которое сейчас ведётся в федеральных и региональных архивах. Второй этап, о котором сейчас говорил Константин Ильич, — это использование современных технологий для распознавания текста. Здесь предстоит большая работа»,

— отметил он.


На фото: Руслан Гагкуев

Одним из проектов в области оцифровки архивных документов с применением искусственного интеллекта является «Digital Пётр» — разработанный в преддверии 350-летия со дня рождения Петра I РИО, фондом «История Отечества» и Сбером проект, который позволяет за несколько секунд получить в удобном и понятном формате расшифровку рукописей Петра Первого. С помощью технологии глубокого обучения на основе девяти тысяч строк петровских текстов разных лет авторы проекта адаптировали параметры нейронной сети под конкретную задачу распознавания почерка императора. Благодаря технологиям компьютерного зрения, обработки естественного языка и графы знаний разработчикам проекта удалось добиться качества расшифровки в 97 %, при этом время распознавания составляет 35 страниц в минуту, тогда как у историков на расшифровку каждой страницы столь сложного почерка уходит по несколько часов.

Работа по цифровизации письменного наследия с помощью искусственного интеллекта ведётся во многих регионах России. Одна из подобных инициатив — проект Центра восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии СО РАН. В 2021 году Сибирское отделение РАН, Новосибирский государственный университет и Центр искусственного интеллекта МТС запустили пилотный проект по применению ИИ для распознавания тибетской письменности. С помощью глубокого обучения в ходе проекта удалось добиться точности распознавания отдельных тибетских символов в 94 %.

Над оцифровкой архивных документов работают и специалисты из Татарстана. В Центре письменного наследия Института языка, литературы и искусства Академии наук Республики Татарстан реализуется проект по цифровизации арабографичных письменных источников. Команда проекта разработала программу «Miras-Tat», позволяющую переводить старотатарские печатные источники сначала в арабицу, а потом в кириллицу. Сейчас результат машинного распознавания текстов достигает 75%. В перспективе программа может быть масштабирована и обучена работе с рукописным текстом, а также с арабографичными источниками на других тюркских языках


Пилотный проект по организации оцифровки документов Архивного фонда разработан и в Российском государственном социальном университете. О нём в ходе конференции рассказал заведующий кафедрой генеалогии и современной архивной работы РГСУ Александр Барков.

Напомним, оцифровке архивных документов и перспективам использования искусственного интеллекта в архивной отрасли был посвящён круглый стол «Цифровизация письменного наследия России: проблемы и перспективы», состоявшийся 22 марта 2023 года в Доме Российского исторического общества.

Текст: Диана Шакирова

Фото: Александр Шалгин

ВЕРСИЯ ДЛЯ СЛАБОВИДЯЩИХ

Поиск по сайту

Мы в соцсетях

Вестник №1/2024

ЗАПИСЬ НА ЭКСКУРСИЮ

КНИГИ

logo.edac595dbigsmall.png

Новости Региональных отделений

В Якутске к 300-летию РАН открылась выставка «Календарь российской истории»

В Якутске к 300-летию РАН открылась выставка «Календарь российской истории»

В преддверии дня Республики Саха (Якутия) и в ознаменование 300-летия Российской академии наук 25 апреля 2024 года в Институте гуманитарных исследований и проблем малочисленных народов Севера СО РАН состоялось открытие выставки «Календарь российской истории: коллекция календарей Михаила Друзьянова».

 

В Алтайском крае состоялась XII открытая межвузовская Олимпиада «Вехи истории»

В Алтайском крае состоялась XII открытая межвузовская Олимпиада «Вехи истории»

24 апреля 2024 года в рамках Дней молодёжной науки в Алтайском государственном университете состоялась двенадцатая открытая межвузовская олимпиада «Вехи истории».

 

В музее-панораме «Сталинградская битва» открылся кинолекторий, посвящённый Ю.В. Бондареву

В музее-панораме «Сталинградская битва» открылся кинолекторий, посвящённый Ю.В. Бондареву

24 апреля 2024 года в музее-панораме «Сталинградская битва» начал свою работу кинолекторий, посвящённый творчеству участника Великой Отечественной войны и Сталинградской битвы, писателя и сценариста, одного из основоположников литературного направления, получившего название «лейтенантская проза», Юрия Васильевича Бондарева.

Прокрутить наверх