ocr

OCR, abréviation de reconnaissance optique de caractères, fait référence à la technologie utilisée pour convertir les caractères imprimés, écrits ou tapés en un format numérique. Le processus permet de lire le texte par un ordinateur, ce qui permet de modifier et de rechercher les caractères. Cette technologie a non seulement révolutionné la saisie de données, mais constitue également un outil utile pour les aveugles et les malvoyants.


Comment fonctionne l'OCR?

Après avoir utilisé un scanner optique pour numériser un document et le décomposer en caractères, la technologie OCR a deux approches différentes pour convertir les caractères en une reconnaissance de formes au format numérique et une détection de caractéristiques.

La reconnaissance de formes, également connue sous le nom de correspondance de matrice et de correspondance de modèle, fonctionne en comparant un caractère qu'il scanne à un backlog d'images de caractères que le programme a dans le fichier. Cela ne fonctionne que lorsque les caractères correspondent exactement aux pixels des caractères que l'OCR utilise comme référence. Dans les années 1960, la police OCR-A a été créée pour être imprimée sur les chèques afin de normaliser la police des programmes OCR de la banque. Finalement, la reconnaissance de formes s'est étendue à la reconnaissance de plusieurs polices courantes comme Arial et Times New Roman, mais le programme était toujours limité à la conversion de caractères qui étaient dans quelques polices sélectionnées.

La détection de caractéristiques, également appelée extraction de caractéristiques, permet à l'OCR de lire les caractères de presque toutes les polices. Au lieu de rechercher la réplique exacte d'un personnage, la détection des fonctionnalités fonctionne en distinguant les fonctionnalités spécifiques qu'un personnage aura quelle que soit la police. Par exemple, si le programme scanne un caractère qui a deux lignes obliques qui se rencontrent en haut pour faire un point, il peut dire que la lettre est une majuscule A. La détection des fonctionnalités étend les utilisations et les capacités des programmes OCR, et est la plus type d'OCR couramment utilisé aujourd'hui.

Bien que l'OCR se limite à la conversion de texte imprimé, la reconnaissance intelligente de caractères (ICR) peut transformer l'écriture manuscrite en texte qui peut être lu, recherché ou modifié par un ordinateur. Bien qu'il fasse partie de la même famille que l'OCR, l'ICR est un processus beaucoup plus difficile car l'écriture manuscrite est plus variée que les polices.

Utilisations pour l'OCR

  • La saisie des données
  • Aider les aveugles et les malvoyants
  • Numérisez des livres
  • Tri du courrier
  • Rendre les fichiers PDF, livres et documents physiques consultables
  • Reconnaissance de plaque d'immatriculation
  • Reconnaissance du passeport

Laisser un commentaire