Transkripcija besedil

Luksemburška nacionalna knjižnica je leta 2020 predlagala projekt, katerega cilj je bil izboljšati prepisovanje različnih besedil z uporabo optičnega prepoznavanja znakov (optical character recognition – OCR). Sposobnost umetne inteligence, da samodejno identificira poimenovane entitete (kraje, osebe, datume, organizacije itd.), je omogočila razvoj interaktivne aplikacije, ki omogoča dinamično raziskovanje novinarskih člankov, s čimer se je izboljšal dostop do arhiva, ki vsebuje digitalne različice različnih časopisov in revij.

Samodejno prepoznavanje starih ročno napisanih dokumentov

Preko projekta CLAVIS, ki ga je predlagal luksemburški nacionalni arhiv (Archives nationales de Luxembourg – ANLux), je bila ustvarjena platforma Transkribus, ki je s pomočjo umetne inteligence sposobna prepisovati rokopisne dokumente iz sedemnajstega in osemnajstega stoletja na podlagi digitalnih fotografij teh dokumentov. Avtomatizirano prepisovanje je omogočilo lažje branje in izkoriščanje različnih virov, ki so do takrat bili težko čitljivi in razumljivi.