Vejledning til fejlretning af politiets efterretninger

Her kan du læse hvordan du gør søgningen i politiets efterretninger bedre, ved at rette de ord, som den automatiske tekstgenkendelse har læst forkert. Fejlretningen foregår i et online værktøj kaldet CorrectOCR.

Sådan gør du

Login 

Du skal være oprettet som bruger på kbharkiv.dk og logget ind, før du kan åbne CorrectOCR. 

Du finder CorrectOCR her:

Oversigt over efterretninger 

På oversigtsiden kan du vælge den efterretning du vil rette. Du kan se, hvornår der sidst er rettet på efterretningen og hvor mange ord, der mangler at blive rettet. 

Vælg en efterretning, hvor der er gået minimum en time siden sidste rettelse. På den måde undgår vi, at der er flere, der retter den samme fejl samtidig. 

Herefter indlæses efterretningen og de ord, der skal rettes. 

Rettesiden 

Det er ordet i midten – kaldet hovedordet – du skal rette. 

Ordene til venstre og højre er ordene, der står før og efter hovedordet i efterretningen. 

Disse ord kan du se, fordi du nogle gange skal lægge ordene sammen, fx ved linjeskift eller hvis ordet fejlagtigt er blevet læst som to ord. 

Du skal sørge for, at alt hvad der er inden for firkanten i billedet af hovedordet, bliver gemt med den korrekte tekst.  

Vær opmærksom på at punktum, komma, bindestreger og parenteser også skal være med. 

Under billedet af ordene kan du se hvad OCR-behandlingen har genkendt ordet som. 

Hovedordet kan rettes på følgende måder: 

  1. Under billedet af hovedordet ses en blå kasse med det ord som programmet mener er rigtigt. Hvis du er enig, klikker på den blå kasse. Ordet gemmes ved klik og næste indlæses. 

  2. Der er også nogle grå kasser. Det er forslag til hvad der står. Hvis et af forslagene er korrekt, vælger du det. Ordet gemmes ved klik og næste indlæses. 
     
  3. Hvis ingen af forslagene er korrekte, skriver du den korrekte tekst i tekstfeltet og klikker gem. 
    Vær opmærksom på at tegnsætning og bindestreger i delte ord også skal med. 
     
  4. Hvis den røde rammer kun dækker noget af ordet, kan du få vist bogstaverne før eller efter, ved at klikke på knapperne ‘Vis ordet før’ eller ‘Vis ordet efter’. Du kan her lægge det, der står før eller efter hovedordet sammen med hovedordet, ved at sætte hak i ’Læg sammen’ og skrive hele teksten i tekstfeltet og gemme.  
    Vær opmærksom på at sammenlagte ord skal skrives med bindestreg, hvis bindestregen fremgår af teksten.  
     
  5. Hvis et hovedord ikke er tekst, fx fugtpletter, dekorative elementer på siden eller fotografier, sletter du hovedordet. 
     
  6. Ser du tilfældigvis at ordet til venstre eller højre er genkendt forkert, kan du vælge at indlæse dette ord som hovedord og rette det. 

Er du i tvivl kan du gøre forskelligt 

  1. Se hele efterretningen og se om du ud fra sammenhængen kan se, hvad der står. 
  1. Spring ordet over 
  1. Fortryder du et ord, du netop har rettet, kan du gå tilbage til ordet ved at klikke på ’Tilbage’. Indtaster du en ny tekst i feltet, overskrives dit første bud. 

  2. Spørg os eller de andre, der retter på forum, hvor vi hjælper hinanden og deler erfaringer

Vær opmærksom på at skrive det der står i efterretningen – ikke det der burde stå 

Indtast kildetro, præcis som der står – også selvom efterretningen indeholder stavefejl eller gammeldags stavemåde. 

Tegnsætning som punktum, komma, citationstegn, bindestreger og parenteser skal også med. Nogle gange kan man dog finde specialtegn i efterretningerne, der er svære at gengive med et moderne tastatur. Så må man bruge det tegn, der minder mest om det i efterretningen.

Bindestreger skal med, hvis der fx ved linjeskift er en bindestreg i efterretningen. 

Eneste undtagelse fra kildetro er datoer

Datoer skrives således 2/7 1883.  

Det vil sige dd/mm åååå uden foranstillede 0’er. Også selvom der i efterretningen fx står 10/9 69, skrives der altså 10/9 1869 

Er der noget der ikke virker?

CorrectOCR er stadig i beta. Det betyder at værktøjet stadig er under udvikling. Oplever du noget, der ikke virker, eller bliver du i tvivl, om det virker rigtigt, vil vi meget gerne have besked.

Skriv til os på mail eller forum og medsend gerne et skærmbillede og/eller et nummer på efterretningeen og evt. ordet.

Eksempler på fejl:

  • Kan CorrectOCR ikke gemme din ændring, springer du ordet over. Send os gerne en mail med skærmbillede og en beskrivelse af problemet.
  • CorrectOCR kan ikke gemme ord, der indeholder mere end en bindestreg. Møder du et sådan ord, så send os gerne en mail med skærmbillede og en beskrivelse af problemet.