DPI staat voor Dots Per Inch, punten per inch.

De term komt oorspronkelijk uit de drukwereld. Het is het aantal puntjes inkt dat per inch gedrukt wordt. Het is een maat voor de kwaliteit van de druk. De standaard drukkwaliteit is 300 dpi. Vandaar wellicht dat OCR systemen op die resolutie het beste werken.

Bron: https://support.google.com/photos/thread/21196444?hl=en

De term is overgezet naar de elektronische wereld, waar de pixeldichtheid wordt uitgedrukt in beeldpunten (pixels) per inch. Je spreekt dan van PPI (Pixels Per Inch). Dat wordt gebruikt voor computermonitoren, smartphoneschermen, sensoren van digitale camera’s, enz. Vaak wordt de term DPI gebruikt ipv PPI.

Ik behandel DPI hier vooral in het kader van digitalisering: van papieren document naar digitaal document, en meer specifiek naar OCR toe.

Voor diepgaander en uitgebreider lectuur lees What is DPI? en The myth of dpi.

Hoeveel dpi heb je nodig voor digitalisering?

Dat hangt er van af wat je wil doen met de digitale afbeelding. Hoe meer dpi hoe meer detail je vastlegt.

De praktijk voor digitale archivering is om te digitaliseren aan de hoogste gewenste resolutie voor het type materiaal. Dat moederbestand wordt nooit bewerkt en op veilige manier opgeslagen. Naargelang het doel maak je dan kopieën met een gelijke of lagere resolutie. Bijvoorbeeld om bij te knippen en kleurcorrecties op toe te passen (en zo een basisbestand te creëren voor verder gebruik van de afbeelding), op een website te zetten, voor in een beeldbank (bvb inzoombaar op verschillende detailniveaus, dus verschillende dpi waarden), voor OCR (300 dpi), …

Gedrukte tekst
Voor gedrukte tekst is 300 dpi voldoende. Dat is de resolutie van goede kwaliteit drukwerk en het is de perfecte resolutie voor OCR systemen.

Foto’s
Fotoafdrukken hebben veel hogere resoluties dan drukwerk. Voor fotografische afdrukken is 600 dpi prima om de details te kunnen zien, bij lagere resoluties verlies je veel beeldinformatie. Bij 1200 dpi zit je meestal rond de resolutie van de foto, je kan er niet meer uithalen dan er in zit. Dus voor foto’s neem je iets tussen 600 en 1200 dpi. Ik neem zelf standaard 600 dpi, het is een afweging tussen detail, scansnelheid en bestandsgrootte.
Het kan wel nuttig zijn om een interessant detail te scannen op 1200 dpi of hoger. Als je een favoriete foto’s heel groot wil afdrukken kan je overwegen om die foto’s aan hogere resolutie te scannen. 

Hieronder lees je meer over dpi in verband met digitaliseren met een scanner of met een camera.

Digitaliseren met een scanner vs. DPI

Bij een scanner moet je eigenlijk spreken van PPI, gescande punten (pixels) per inch. Maar omdat we dat zo gewoon zijn in de marketingtalk  van scannerfabrikanten wordt de term DPI gebruikt om PPI aan te duiden.

Voor voldoende controle over de dpi waarop je scant, over het exacte te scannen gebied, over automatisch rechtzetten, e.d. zal je sowieso via de “geavanceerde” opties van je scansoftware moeten werken. Dat vraagt wat lees, zoek en experimenteerwerk. 

Optische resolutie: wat betekent zoiets als “2400 x 4800 dpi” ?

Als je scant kies je een exacte DPI waarde. Ga nooit hoger dan de opgegeven optische resolutie, dat is wat de scanner technisch aankan. Alles wat hoger is wordt softwarematig berekend en maakt de kwaliteit niet beter.

Het is niet altijd duidelijk wat de optische resolutie van je scanner is. De doos vermeld vaak ‘opgepompte’ softwarematige resoluties om indrukwekkender over te komen.

Ergens in de specificaties zal de optische resolutie vermeld staan als 2 getallen, bijvoorbeeld een flatbedscanner van 2400 x 4800 dpi.

Je moet alleen naar het laagste getal kijken. Dat is de optische resolutie van de sensor. Het is het aantal pixels dat de bewegende lange smalle sensor over de korte zijde van de scannerplaat kan registreren (2400 in ons voorbeeld). Meer daarover in: Evaluating Scanner Features and Specifications – Resolution.

“Bij het scannen met een hoge resolutie, is het scanformaat beperkt”

Iets dergelijks kan je in de kleine lettertjes van de handleiding lezen. Je kan dus maar een klein stukje scannen aan 2400 dpi of 1200 dpi. Hoe klein? Vanaf welke resolutie? Kan je een foto van 8 x 12 cm scannen aan 1200 dpi optische resolutie? Dat kom je niet te weten! 

Maximale resolutie waarop je een A4 kunt scannen?

Met wat geluk vind je dat in de kleine lettertjes. Zoek de gedetailleerde specificaties op de website van de fabrikant. Daar staat dan iets als maximum optical resolution for A4 scan is 600dpi

In de praktijk kan je dus met een 2400 x 4800 dpi flatbed scanner een A4 formaat scannen op 600 dpi. Toch met mijn Canon MX925 all-in-one.
Hoe dat met mijn Epson V550 zit kan ik niet vinden in de specificaties, maar het zou hoger moeten zijn want het is een 6.400 x 9.600 dpi scanner. Die hoge resolutie heb je nodig om dia’s of negatieven te scannen, alleen zo haal je voldoende detail uit die kleine beeldjes.

Besluit

Voor je een scanner koopt eerst goed de specificaties nakijken of hij wel voldoet aan je noden.

Digitaliseren met een digitale camera vs. DPI

Voor een camera kan je niet zomaar een DPI waarde stellen. Daarvoor heb je een referentie nodig naar een afmeting in de echte wereld. Je hebt de afmetingen nodig van wat je gefotografeerd hebt in verhouding tot de hoeveelheid pixels die dat inneemt op de foto. De waarde is afhankelijk van de resolutie van de camerasensor en de mate van beeldvulling door het gefotografeerde document.

Bij de totale kwaliteit van de foto speelt de grootte van de sensor, de ISO setting (bepaalt de ruis bij weinig licht), de belichting (veel licht van daglichtkwaliteit) en de vertekening door de lens of door de positie van de camera tov het onderwerp. Voor diepgaander lectuur zie bvb What is ISO? en The myth of dpi.

Hieronder enkele tests met verschillende camera’s:

  1. Canon EOS RP, 26.2 MP 
  2. Apple iPhone 6s, 12 MP
  3. Konica Minolta DiMAGE Z2, 4 MP
  4. Theoretische 1.3 MP camera

Een klassiek bidprentje meet ongeveer 7 x 11 cm. Dat is ± 2.76 x 4.33 inch.
(cm delen door 2,54 is inch). 

  • Fotografeer het bidprentje zo beeldvullend mogelijk zonder vervorming. Digitaal inzoomen helpt niet, dat knipt eigenlijk alleen het beeld uit zodat je met een lagere resolutie eindigt. Optische zoom helpt wel om een goede beeldvullende foto te maken.
  • Knip de foto bij zodat alleen het bidprentje beeldvullend overblijft.
  • In de bestandsinfo (Eigenschappen in Windows Explorer, of in een grafisch programma) lees je wat de afmetingen in pixels (beeldpunten) zijn.
  • Je berekent het aantal pixels per inch: pixelwaarde gedeeld door lengte in inch.

Voorbeeld 1: Bidprentje fotograferen met 26.2 MP SLR camera

Voor topkwaliteit gebruiken we een Canon EOS RP, full frame, Single Lens Reflex camera van 26.2 megapixels. Gebruikt met een 50 mm macro lens.

Volledige foto, niet volledig beeldvullend. (hier 20% van de werkelijke grootte)
Bijgeknipt 4659 x 3123 pixels (hier 20% van de werkelijke grootte)
 

Dit is een bidprentje van 15,1 x 10,1 cm groot, omgerekend naar inch ± 5.9″ op 4″.

Horizontale dpi: 4659 pixels / 5.9″ = 790 dpi
Verticale dpi: 3123 pixels / 4″ = 780 dpi

Voorbeeld 2: Bidprentje fotograferen met 12 MP iPhone 6s camera

Volledige foto, zo veel mogelijk beeldvullend (hier 20% van de werkelijke grootte)
Bijgeknipt 2395 x 3957 pixels (hier 20% van de werkelijke grootte)
 

Het prentje krult wat op, daardoor lijken de boven- en onderrand gebogen.

Het bijgeknipte klassieke bidprentje is 2395 x 3957 pixels groot.

Horizontale dpi: 2395 pixels / 2.76″ = 868 dpi
Verticale dpi: 3957 pixels / 4.33″ = 914 dpi

Voorbeeld 3: Bidprentje fotograferen met oude 4 MP camera

We gebruiken een Konica Minolta DiMAGE Z2, 4 megapixels uit 2004. Deze levert beelden van 1704 x 2272 pixels. Dat geeft een maximum van 2272 / 4.33″ = 525 dpi.

Zoals je kan zien is er een grote kussenvervorming met de lens van de DiMAGE. Door de vervorming word aan de boven- en onderrand de buiging bijna weggewerkt, maar je ziet het goed aan de bolle zijranden. Eigenlijk moet je dan minder beeldvullend gaan werken, met lagere resolutie dus, want de vervorming kan OCR negatief beïnvloeden.

Volledige foto (hier 20% van de werkelijke grootte)
 

Voor dit prentje, dat bijgeknipt 1244 x 2040 pixels meet, kom je aan: 

Horizontale dpi: 1244 pixels / 2.76″ = 451 dpi
Verticale dpi: 2040 pixels / 4.33″ = 471 dpi

Een A4 blad ga je hiermee niet aan 300 dpi gedigitaliseerd krijgen. Dat is 8.3 x 11.7 inch, dus in de hoogte maximaal 2272 / 11.7″ =  194 dpi. In de praktijk zal je eerder aan 150 dpi zitten omdat je de foto niet volledig beeldvullend kan maken.

Voorbeeld 4: Bidprentje fotograferen met 1.3MP camera

In theorie is een camera met een resolutie van 1,3 megapixel al voldoende om een 300 dpi beeld te maken van een bidprentje.

De sensor van zo’n camera heeft een grootte van 1280 op 960 pixels. Het volledige beeld van de resulterende foto heeft dus die pixelafmetingen.

Dit is een theoretische test, ik heb geen werkende 1,3MP camera meer.
Als je het volledig beeldoppervlak vult met een bidprentje dan heeft het resultaat een dpi in de hoogte van het prentje van: 1280/4.33″ = 295,6 ppi
en in de breedte: 960/2.76″ = 347,8 ppi Dat volstaat dus net om aan de 300 dpi vereisten van OCR te voldoen.

Besluit

=> Je hebt geen topapparatuur nodig om goed te digitaliseren met een camera.
Aan de 300 dpi die nodig is voor goede OCR geraak je gemakkelijk, al is dat afhankelijk van de werkelijke grootte van het document.
Voor de min. 600 dpi die aan te raden is voor foto’s heb je best een goede camera met veel megapixels. Maar 12MP is al ruim voldoende.

=> Als je documenten zoveel mogelijk beeldvullend fotografeert verkrijg je de hoogste resolutie in DPI. Maar let op voor kussenvervorming, de kwaliteit van de lens speelt ook mee.

=> Hoe groter het document dat je fotografeert, hoe lager de resolutie in DPI.

=> Een scanner is vaak praktischer voor een consistente kwaliteit: je hebt controle over de DPI, de documenten worden mooi platgedrukt en je hebt geen last van vervormingen.