Mrežna radionica Kako uspješno trenirati model za prepoznavanje rukopisnoga teksta za hrvatsku glagoljicu / Online workshop Training Handwritten Text Recognition models for Croatian Glagolitic

Znanstveni centar izvrsnosti za hrvatsko glagoljaštvo i Staroslavenski institut organiziraju mrežnu radionicu KAKO USPJEŠNO TRENIRATI MODEL ZA PREPOZNAVANJE RUKOPISNOGA TEKSTA ZA HRVATSKU GLAGOLJICU, koja će se održati u četvrtak 12. svibnja 2022. od 10:00 do 12:00 sati na platformi Zoom.

Sažetak radionice: Suvremena postignuća u području strojnoga čitanja rukopisnoga teksta (Handwritten Text Recognition – HTR) omogućila su uspješno strojno preslovljavanje hrvatskoglagoljičnih rukopisnih i tiskanih spomenika s malom razinom pogreške, čime se uvelike ubrzava urednički proces u pripremi njihovih preslovljenih izdanja. Modeli za strojno preslovljavanje i rukopisnih i tiskanih hrvatskoglagoljičnih knjiga već su izrađeni i dostupni su u okviru mrežne platforme Transkribus. Ipak, radi što vjernijega strojnog preslovljavanja, pojavljuje se potreba za izradom specifičnih modela usko usmjerenih na pojedine hrvatskoglagoljične rukopisne i tiskane dokumente. U radionici će prof. dr. Rabus predstaviti načine uspješnoga treniranja upravo jednoga takvog modela za tiskanu glagoljicu, no potrebni su postupci dakako primjenjivi i na ostale vrste pisama.

O izlagaču: Prof. dr. sc. Achim Rabus predstojnik je Katedre za slavensku lingvistiku na Sveučilištu u Freiburgu u Njemačkoj. Doktorirao je 2008. godine obranom rada na temu jezika istočnoslavenskih duhovnih pjesama i habilitirao 2014. godine obranom rada na temu slavenskih jezičnih dodira. Član je posebne Komisije za strojnu obradu srednjovjekovnih slavenskih rukopisa i ranih tiskanih knjiga pri Međunarodnome komitetu slavista, a od 2018. je i predsjednik te Komisije. Osnovna su mu područja interesa: slavenska sociolingvistika i dijalektologija, strojno čitanje rukopisa (HTR), korpusno utemeljena povijesna lingvistika i digitalna povijesna lingvistika.

Upute za sudionike: Slušači radionice pozvani su upoznati se s radom u mrežnom programu Transkribus i s člankom prof. dr. Rabusa posvećenim strojnom čitanju rukopisne i tiskane hrvatske glagoljice objavljenim u posljednjemu broju časopisa Slovo (dostupno na poveznici URL: https://hrcak.srce.hr/file/391286).

Pristupiti radionici možete klikom na poveznicu: https://uni-freiburg.zoom.us/j/61246200955?pwd=Z3NYbEdocVUzWVJNUlQ0M1VOUXU1QT09

Meeting-ID: 612 4620 0955

Keycode: hWBLHq1di

 

Workshop title: Training Handwritten Text Recognition models for Croatian Glagolitic

Summary: Recent advances in the area of Handwritten Text Recognition make it possible to produce a computer-generated pre-transcription of Croatian Glagolitic manuscripts and early printings with a low error rate, thus greatly speeding up editorial work. While transcription models for both handwritten and printed Glagolitic have already been published within the Transkribus platform, there is need for additional transcription models tailored towards specific sources.

In this workshop, prof. dr. Achim Rabus will give an introduction how to train transcription models for Glagolitic (and other scripts) using the Transkribus platform, allowing researchers to speed up their editorial work.

Biography: Prof.  dr.  Achim Rabus holds the Chair of Slavic Linguistics at the University of Freiburg, Germany. Rabus defended his PhD thesis on the language of East Slavic spiritual songs in 2008 and his Habilitationsschrift on Slavic language contact in 2014. Since 2009, Rabus has been a member of the Special Commission on the Computer-Supported Processing of Mediæval Slavonic Manuscripts and Early Printed Books to the International Committee of Slavists, and since 2018, the President of the Commission. His current research focuses on Slavic social dialectology, Handwritten Text Recognition, corpus and (digital) historical linguistics.

Zoom link:

https://uni-freiburg.zoom.us/j/61246200955?pwd=Z3NYbEdocVUzWVJNUlQ0M1VOUXU1QT09

12. May 2022 10:00 AM Sarajevo, Skopje, Zagreb

Meeting-ID: 612 4620 0955

Kenncode: hWBLHq1di