Нейросеть от «Яндекс» научилась распознавать дореволюционную орфографию

25.01.2023 11:08

Компания «Яндекс» приступила к расшифровке рукописных документов из архивов, написанных до начала XX века при помощи нейросети, которая “научилась” распознавать символы, давно вышедшие из употребления в письменном языке.

Об этом пишет издание “Коммерсантъ”

На сегодняшний день при использовании опции “поиск по архивам” можно изучить порядка 2,5 тысяч страниц архивных материалов, к которым также прилагается понятная расшифровка написанного. 

Все исторические документы разделены по категориям и каталогизированы. 

В дополнение к этому работает развитая система поиска по фамилиям, населенным пунктам или просто отдельным словам в тексте, а также можно отфильтровать не нужные материалы по временному периоду, описям, фондам или архивам. 

Фото: Pixabay

Пользователь сможет изучить не только отсканированный исторический документ, но и прилагающуюся к нему построчную расшифровку, сделанную нейросетью “Яндекс”, которая проходила обучение под наблюдением историков на базе рукописных записей XVII–XIX веков, собранных в Главном архиве Москвы. 

Сейчас помимо этого фонда в сервисе также размещены бумаги из Новгородской и Оренбургской областей. 

Сообщается, что в будущем количество оцифрованных архивов из разных частей страны будет увеличиваться.  
 

Автор: Александра Дударчик Редактор интернет-ресурса