er ikke altid

af Jens V. Olsen, Roskilde

Der er en stående diskussion om kvaliteten af de digitaliserede udgaver af kirkebøger og folketællinger, som leveres af Statens Arkiver under betegnelsen Arkivalier Online (AO).

Et af de svar, der kommer fra AO er, at da de mikrofiche, der danner grundlaget for de digitale billeder, er sort/hvide, så har man lavet skanningen i sort/hvid.

Det er et udsagn, der er tegn på en total misforståelse af den teknik, man har brugt, og den man burde bruge.

Mikrofichene er en fotografisk optagelse af den originale kilde uden brug af farver. Derfor kaldes en sådan optagelse et sort/hvid billede.

Som det burde være enhver bekendt, så kan der i et sort/hvid fotografi forekomme alle varianter af gråtoner spændende fra det rent hvide til det rent sorte. Det er også tilfældet for alle de gamle arkivalier, der er håndskrevet med blæk af meget forskellig kvalitet og intensitet på papir, der for mange år siden har mistet sin rene hvide farve, men nu er gulnet og grånet med skjolder og reparationer med halvgennemsigtig gaze og lignende.

Skanningerne, der leveres af AO er også sort/hvide, men digital sort/hvid, der kun indeholder to nuancer, nemlig rent sort og rent hvid og INGEN som helst gråtoner.

En sådan repræsentation af en gammel kirkebog kan kun blive en meget dårlig afbildning, hvor mange detailler vil gå tabt.

Hvis man vil lave en digital gengivelse af en sort/hvid fotografisk optagelse af et gammelt arkivalie, så skal man skanne med gråtoner, i fagsproget grayscale.
Den fotografiske teknik tillader gengivelse af et meget stort dynamikområde, hvilket især kan ses ved lysbilledgengivelse, hvor nuancer kan skelnes i selv de mørkeste skygger.
En digital gråtonegengivelse indeholder kun 256 forskellige niveauer fra hvid til sort, men ved passende justering kan opnås en meget god tilnærmelse til den rent optiske gengivelse.

Et klart eksempel på forskellen mellem gråtoneskanning og sort/hvid skanning vises nedenfor:

Et lille udsnit skannet i gråtoner direkte fra mikrofichen.
Billedet er skannet med en Epson skanner med den optiske opløsning 1600 x 3200 pixel pr. inch (ppi).
Skanningen er sket med opløsningen 3200 x 3200 ppi (delvis interpoleret).
Det digitale billedudsnit er på 360 x 96 pixels. Format: GIF

Denne gengivelse er så tæt på at være kildetro, som man med rimelighed kan kræve.

Det tilsvarende udsnit fra AO gengivet i samme skala.
Her er billedet skannet i rent sort/hvid, men med en meget større opløsning for at opnå en delvis kompensation for det oprindelige billedes gråtoner gennem den såkaldte dithering teknik, hvor spredte sorte pixels repræsenterer en grå nuance.
Ved omskaleringen fra udsnittets oprindelige 1229 x 329 pixels til gengivelsens 360 x 96 pixels er billedet reelt ændret fra sort/hvid til gråskala for at bedst muligt at gengive den effekt, der opnås ved den tilsvarende formindskning ved visning direkte fra AO.

Den benyttede kilde er første side fra den ældste kirkebog (1660-1714) for Sdr. Dalby sogn, Præstø amt. (LAK 1-496-1, fiche 1/5)

Forskellen på de to gengivelser ses tydeligt.
Hvor originalens skrift er ren og klar på en jævn baggrund, er AO gengivelsen endog lidt mere læselig, men i de områder, hvor originalen er uklar, er den læselig i gråtoneskanningen, men helt ulæselig i AOs gengivelse.

Herunder vises i stor forstørrelse de tre første ord på ovenstående billede i henholdsvis den "grove" gråtoneskanning, hvor de enkelt pixels kan ses og den "fine" rent sort/hvide skanning fra AO. Så kan I selv dømme.


Et andet argument fra AO, som der skal tages stilling til er spørgsmålet: Hvor meget fylder så de to forskellige skanninger.

Gråtoneudsnittet, lagret i det tabsfri GIF-format fylder 37 kB, medens det samme billede i JPEG med en rimelig kompression (60) fylder 7 kB.
Til sammenligning gengives jpeg-udgaven herunder:
Her vises det ovenstående billede i det væsentlig mindre pladskrævende JPEG format. Forskellen kan næppe skelnes.

AO udgaven af det samme udsnit reskaleret fylder i GIF-formatet 15 kB. Det oprindelige AO udsnit fylder 17 kB i den på AO anvendte TIFF variant, der hedder CCITT Group 4 Fax Encoding, medens samme originaludsnit i GIF-formatet også fylder 17 kB.

Det sidste viser, at der INGEN gevinst er ved at lagre de oprindelige skanninger i det specielle Fax-format, der kræver specielle programmer for visning i modsætning til gif-formatet, der direkte kan vises på skærmen.


Detailler der forsvinder

På samme opslag, som ovenfor viste udsnit stammer fra, findes den nyere skrevne indholdsfortegnelse til bogen.
Her følger et udsnit:

Her kan under Daabsindførslen læses en senere anmærkning, formentlig skrevet med blyant:

Anm. For året 1689 findes kun to indførsler
om dåb. Resten mangler.

Denne vigtige oplysning referer til, at der mangler to blade med 4 siders dåbsindførsler mellem Dom. oculi (3/3)-1689 og septuagesima (16/2)-1690.

Samme udsnit fra AO:

Hvor meget kan I læse her ? - Er det en kildetro gengivelse.


Bemærk - denne webside er lavet i sort/hvid (grayscale)


Opdateret den 30. November 2004 - Jens V. Olsen (e-mail)