Vi søger frivillige korrekturlæsere
Er du en habil håndskriftlæser – og måske ligefrem af gotisk håndskrift – er dette måske noget for dig.
Vi søger frivillige, der vil være med til at afgøre om automatisk transskriberet historisk håndskrift er aflæst korrekt. Samtidig er du med til at træne programmet, så det bliver bedre til at læse håndskrift næste gang.
Hvad er automatisk transskriberet håndskrift?
Automatisk transskriberet håndskrift er tekst, der er genereret ved at et avanceret computerprogram ’kigger’ på den håndskrevne tekst, aflæser den og omdanner den computerlæsbar tekst. Teknologien bygger på AI – såkaldt kunstig intelligens.
I disse år udvikler de teknologiske muligheder sig hurtigt og automatisk transskription er blevet ålidelig. Kvaliteten afhænger af hvor pænt teksten er skrevet og hvor gammel den er og hvor meget lignende tekst programmet er trænet på.
Man kan forbedre resultatet ved at korrekturlæse computerens arbejde og anvende korrekt transskriberede tekster til at træne programmet til netop den håndskrift, man ønsker læst.
Korrekturlæsning og træning
Vi bruger programmet Transkribus til at generere automatisk transskriberet håndskrift.
Som frivillig korrekturlæser får du en brugerkonto til Transkribus. Når du er logget ind, vil du få adgang til de protokoller, som vi har transskriberet og som kan korrekturlæses.
Korrekturlæsningen består af to ting: Er teksten aflæst korrekt? Er teksten aflæst i korrekt rækkefølge? Hvis ikke, retter du teksten til det rigtige – side for side.
Mange synes at Transkribus er lidt overvældende i starten. Men selvom der er mange muligheder i programmet, et det langt fra dem alle du skal bruge som korrekturlæser – og du får hjælp og vejledning af os til at komme godt i gang.
Det kan variere meget fra protokol til protokol, hvor god den automatisk transskriberede tekst er. Afhængig af kvaliteten vurderer vi hvor meget af en protokol bør korrekturlæses og/eller om programmet skal trænes yderligere på baggrund af korrekturlæst tekst.
Selv en korrekturlæser kan komme i tvivl
Det er ikke et mål at alt skal være 100 % fejlfrit eller at alle sider skal korrekturlæses.
Møder du ord eller bogstaver du ikke læse, kan du markere dem i Transkribus og hoppe videre i teksten.
Hvilke arkivalier kan korrekturlæses?
Vi arbejder primært med protokoller fra 1700-tallet og starten af 1800-tallet.
Eksempler kan være resolutionsprotokoller fra Magistraten eller forhandlingsprotokoller fra Stadens 32 mænd.
Protokollerne er valgt ud fra forskellige hensyn – primært: Hvordan de er er (hånd)skrevet, samt brugsmulighederne af den transskriberede tekst for forskere og andre brugere.
Perspektiver ved automatisk transskriberet håndskrift
Arkivets samlinger på papir er for langt størstedelen håndskrevet. For mange er håndskrift svær at læse og især for yngre generationer kan det være rigtig svært.
Derfor har vi og mange andre arkiver i mange år samarbejdet med frivillige om at transskribere den håndskrevne tekst, så den blev let at læse. Når den håndskrevne tekst er omdannet til moderne tekst bliver den samtidig søgbar og kan anvendes til nye og andre forskningsformål.
Men det tager lang tid at transskribere arkivalier, når mennesker gør det. Med computerne i ryggen er det forventningen at vi på sigt kan gøre flere arkivalier søgbare end ved udelukkende menneskelig transskription. Men computerne kan ikke gøre det alene. Gode resultater kræver et samarbejde mellem mennesker og computere.
Vil du være med?
Tilmeld dig en tastecafé hvor du kan få en introduktion til korrekturlæsning i Transkribus. Se hvornår i oversigten over arkivets arrangementer.
Er der (for) lang tid til næste tastecafe er du også velkommen til at skrive til arkivar Eva Greve Mortensen på xm9p@kk.dk.