Gør automatisk transskriberet håndskrift bedre

Med avanceret teknologi er det muligt at omforme historisk håndskrift til moderne søgbar tekst. Men aflæsningen er ikke uden fejl. Vær med til at opmærke siderne og læse korrektur - og gør samtidig teknologien bedre.

Skærmbillede fra Transkribus

Vi søger frivillige der vil løse opgaver med automatisk transskriberet håndskrift

Er du en habil håndskriftlæser – og måske ligefrem af gotisk håndskrift – er dette måske noget for dig.

Vi søger frivillige, der vil være med til at forberede sider til automatisk transskription og siden korrekturlæse resultatet. Samtidig er du med til at træne programmet, så det bliver bedre til at læse håndskrift næste gang.

Hvad er automatisk transskriberet håndskrift?

Automatisk transskriberet håndskrift er tekst, der er genereret ved at et avanceret computerprogram ’kigger’ på den håndskrevne tekst, aflæser den og omdanner den computerlæsbar tekst. Teknologien bygger på AI – såkaldt kunstig intelligens.

I disse år udvikler de teknologiske muligheder sig hurtigt og automatisk transskription er blevet pålidelig. Kvaliteten afhænger af hvor pænt teksten er skrevet og hvor gammel den er og hvor meget lignende tekst programmet er trænet på.

Man kan forbedre resultatet ved at opmærke siderne, korrekturlæse computerens arbejde og anvende korrekt transskriberede tekster til at træne programmet til netop den håndskrift, man ønsker læst.

Korrekturlæsning, opmærkning af sider og træning af programmet

Vi bruger programmet Transkribus til at generere automatisk transskriberet håndskrift.

Som frivillig korrekturlæser får du en brugerkonto til Transkribus. Når du er logget ind, vil du få adgang til de protokoller, som vi sammen arbejder på.

Der er flere forskellige typer opgaver man kan være med til, primært:

  • Korrekturlæsning
    Er teksten aflæst korrekt? Hvis ikke, retter du teksten til det rigtige – side for side.

  • Opmærkning/forberedelse af sider
    Hvordan er siden struktureret? Inddel siden i regioner, der hjælper den automatiske transskription til at aflæse sidens linjer og tekstens rækkefølge korrekt.

Mange synes at Transkribus er lidt overvældende i starten. Men selvom der er mange muligheder i programmet, et det langt fra dem alle du skal bruge – og du får hjælp og vejledning af os til at komme godt i gang.

Det kan variere meget fra protokol til protokol, hvordan den er opbygget og skrevet. Afhængig af håndskriften, vurderer vi hvilke opgaver, der skal udføres for at den kan blive automatisk transskriberet og i hvor stort omfang korrekturlæsning er nødvendig.

Hvilke arkivalier arbejder vi med?

Vi arbejder primært med protokoller fra 1700-tallet og starten af 1800-tallet.

Eksempler kan være resolutionsprotokoller fra Magistraten eller forhandlingsprotokoller fra Stadens 32 mænd.

Protokollerne er valgt ud fra forskellige hensyn – primært: Hvordan de er er (hånd)skrevet, samt brugsmulighederne af den transskriberede tekst for forskere og andre brugere.

Perspektiver ved automatisk transskriberet håndskrift

Arkivets samlinger på papir er for langt størstedelen håndskrevet. For mange er håndskrift svær at læse og især for yngre generationer kan det være rigtig svært.

Derfor har vi og mange andre arkiver i mange år samarbejdet med frivillige om at transskribere den håndskrevne tekst, så den blev let at læse. Når den håndskrevne tekst er omdannet til moderne tekst bliver den samtidig søgbar og kan anvendes til nye og andre forskningsformål.

Men det tager lang tid at transskribere arkivalier, når mennesker gør det. Med computerne i ryggen er det forventningen at vi på sigt kan gøre flere arkivalier søgbare end ved udelukkende menneskelig transskription. Men computerne kan ikke gøre det alene. Gode resultater kræver et samarbejde mellem mennesker og computere.

Vil du være med?

Tilmeld dig en tastecafé, hvor du kan få en introduktion til de foskellige opgaver i Transkribus. Se hvornår i oversigten over arkivets arrangementer.

Er der (for) lang tid til næste tastecafe er du også velkommen til at skrive til arkivar Eva Greve Mortensen på xm9p@kk.dk.