Direct naar inhoud
Alle termenGeneratieve AI & multimodaal

Wat is Optical Character Recognition?

Technologie waarmee computers gedrukte of handgeschreven tekst in afbeeldingen kunnen herkennen en omzetten naar bewerkbare tekst — zoals je telefoon die een visitekaartje scant.

Wat is Optical Character Recognition

Wat is Optical Character Recognition?

Stel je voor: je maakt een foto van een kassabon, en je telefoon zet alle bedragen automatisch om in een boekhoudingsbestand. Of je scant een oud boek, en binnen seconden kun je de tekst kopiëren en plakken. Dat is Optical Character Recognition (OCR) — een technologie die beelden met tekst omzet in machine-leesbare letters en cijfers.

OCR bestaat al decennia, maar dankzij AI is het de laatste jaren véél slimmer geworden. Waar oudere systemen moeite hadden met lastig leesbare lettertypes of handgeschreven notities, kunnen moderne OCR-systemen nu zelfs gekrabbelde recepten of vervaagde documenten ontcijferen.

Hoe werkt het eigenlijk?

Het proces begint met een afbeelding — een foto van een pagina, een screenshot, een PDF-scan. Het OCR-systeem analyseert die afbeelding in verschillende stappen:

  • Voorbewerking: de afbeelding wordt schoongemaakt (contrast verhogen, ruis verwijderen, rechttrekken als het scheef gefotografeerd is)

  • Tekstdetectie: het systeem vindt waar in de afbeelding zich tekst bevindt

  • Karakterherkenning: elk letter of cijfer wordt herkend en omgezet naar een digitaal teken

  • Nabewerking: spellingscontrole en contextanalyse corrigeren eventuele fouten

Moderne OCR gebruikt machine learning-modellen die getraind zijn op miljoenen voorbeelden van tekst in allerlei lettertypes, talen en omstandigheden. Daardoor kunnen ze patronen herkennen die voor mensen vanzelfsprekend zijn maar voor computers vroeger onmogelijk waren — zoals het verschil tussen een hoofdletter I en een kleine letter l.

Een voorbeeld uit de praktijk

Een boekhouder fotografeert tientallen bonnetjes met zijn smartphone. De OCR-software herkent niet alleen de bedragen, maar ook de datum, het BTW-nummer en de omschrijving van de uitgave. Het systeem vult automatisch de juiste velden in zijn boekhoudprogramma in. Wat vroeger een uur handmatig tikwerk kostte, gebeurt nu in enkele seconden.

Of neem een bibliotheek die oude archieven digitaliseert. Met OCR worden eeuwenoude documenten doorzoekbaar — onderzoekers kunnen meteen zoeken op trefwoorden in plaats van pagina voor pagina door te bladeren.

Waar kom je het tegen?

Je gebruikt OCR waarschijnlijk vaker dan je denkt:

  • Mobiele scanner-apps zoals Adobe Scan, Microsoft Lens of de ingebouwde scanner in Apple Notes

  • Vertaalapps zoals Google Translate die tekst uit foto's kunnen vertalen

  • Notitie-apps die handgeschreven notities omzetten naar getypte tekst

  • Cloudopslag zoals Google Drive en Dropbox die je gescande documenten doorzoekbaar maken

  • Online boekhoudtools zoals Exact Online of Moneybird die bonnetjes automatisch verwerken

  • Toegankelijkheidsfuncties die tekst op je scherm voorlezen

  • Postverwerkingssystemen die adressen op enveloppen automatisch lezen

Wat zijn de valkuilen?

OCR is indrukwekkend, maar niet foutloos. Bij slechte foto's (wazig, scheef, slecht licht) of ingewikkelde lay-outs (tabellen, kolommen, afbeeldingen tussen tekst) kunnen er fouten sluipen. Handgeschreven tekst blijft lastiger dan gedrukte tekst, vooral als het handschrift slecht leesbaar is.

Ook context is soms moeilijk: een OCR-systeem kan "1" en "I" door elkaar halen als het niet begrijpt of er een cijfer of letter hoort te staan. Daarom gebruiken moderne systemen vaak language models die controleren of de herkende tekst logisch is.

Waarom zou jij hier iets aan hebben?

OCR bespaart je tijd bij alles wat met papier naar digitaal gaat. In plaats van handmatig over te tikken, laat je de computer het werk doen. Voor ondernemers betekent dit: minder administratieve rompslomp. Voor studenten: sneller digitale aantekeningen. Voor archivarissen: doorzoekbare collecties.

Bovendien wordt OCR steeds slimmer door AI. Nieuwe modellen begrijpen niet alleen wat er staat, maar ook wat het betekent — ze kunnen een factuur niet alleen scannen, maar ook begrijpen welk bedrag bij welke post hoort. Dat maakt OCR een belangrijk onderdeel van grotere automatiseringssystemen.

Wil je OCR zelf uitproberen? Maak eens een foto van een gedrukte pagina met de camera-app op je telefoon en selecteer de tekst — veel smartphones hebben OCR inmiddels ingebouwd. Of scan een oud document in Google Drive en zoek op een woord dat erin voorkomt. Je zult merken hoe vanzelfsprekend deze technologie inmiddels is geworden.

FAQ

Veelgestelde vragen over Optical Character Recognition

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is Optical Character Recognition?

Technologie waarmee computers gedrukte of handgeschreven tekst in afbeeldingen kunnen herkennen en omzetten naar bewerkbare tekst — zoals je telefoon die een visitekaartje scant.

Waarom is Optical Character Recognition belangrijk?

Stel je voor: je maakt een foto van een kassabon, en je telefoon zet alle bedragen automatisch om in een boekhoudingsbestand. Of je scant een oud boek, en binnen seconden kun je de tekst kopiëren en plakken. Dat is Optical Character Recognition (OCR) — een technologie die beelden met tekst omzet in machine-leesbare letters en cijfers.

Hoe wordt Optical Character Recognition toegepast?

OCR bestaat al decennia, maar dankzij AI is het de laatste jaren véél slimmer geworden. Waar oudere systemen moeite hadden met lastig leesbare lettertypes of handgeschreven notities, kunnen moderne OCR-systemen nu zelfs gekrabbelde recepten of vervaagde documenten ontcijferen.

Deel: