OCR (optical carácter recognition), consiste en la identificación automatizada de símbolos o caracteres pertenecientes a un determinado alfabeto, a partir de una imagen recogida mediante la lectura óptica de un texto grabado en un apoyo real.
La tecnología OCR llega hoy en día, tanto a empresas directamente relacionadas con la digitalización y la gestión documental con requerimientos de grandes volúmes de datos, como a la administración pública y a una gran variedad de Pymes.
Esto se debe en parte a la gran versatilidad de campos de aplicación.
Existen sistemas de OCR muy diversos según los tipos de problemas que abordan y las funcionalidades que ofrecen.
Respecto de reconocimiento de caracteres y símbolos propiamente dicho, existe una terminología de empleo extendido en la industris para referirse a cada una de las variantes específicas de sistemas OCR:
- ICR (intelligent carácter recognition) se utiliza para desihnar el reconocimiento de caracteres manuscritos
- OCV (optical Character verification) hace referencia a la verificación de contenidos previamente conocidos.
- OMR (optical mark recognition) designa una funcionalidad de reconocimiento de marca.
El sistema de OCR no solo identifica caracteres, también puede utilizarse para el reconocimiento de marcas (OMR) y la lectura de códigos de barras en cualquier formato en 1D y 2D. A la vez, mediante la identificación de áreas clave, puede autoclasificar una página aplicándole etiquetas.
No hay comentarios:
Publicar un comentario