Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/2776
Desarrollo de un sistema de detección y reconocimiento de texto multi-orientado en imágenes naturales bajo iluminación no uniforme
Multi-oriented natural text detection and recognition system under non-uniform illumination
JULIA DIAZ ESCOBAR
VITALI KOBER
Acceso Abierto
Atribución
detección y segmentación de texto, iluminación no uniforme, señal monogénica, OCR
text detection and segmentation, non-uniform illumination, monogenic signal, OCR
La detección y reconocimiento de texto en imágenes naturales se refiere al proceso de localizar regiones de texto en una imagen capturada por un dispositivo móvil y convertir el texto en código único “entendible” para un ordenador o crear un archivo de texto editable. Los sistemas de detección y reconocimiento de texto contribuyen en múltiples aplicaciones relacionadas con clasificación de documentos, recuperación multimedia, interacción humana-computadora, navegación robótica y realidad aumentada. A diferencia de las imágenes digitalizadas por medio de un escáner, donde las condiciones de captura son controladas, las imágenes naturales suelen verse afectadas por aspectos ambientales, condiciones de captura y contenido del texto. Por esta razón, en este trabajo de tesis se proponen nuevos métodos de detección y reconocimiento de texto en imágenes naturales. En este trabajo se abordan los problemas de detección y reconocimiento de texto multi-orientado bajo condiciones de iluminación no uniforme, baja resolución y presencia de ruido aditivo. Se consideró el alfabeto latino sin acentos, así como los números del 0 al 9. Se consideró sólo texto escrito a máquina, con diferentes tipos de fuente y tamaños, así como fondos simples y complejos. El método propuesto de detección y segmentación de texto se basa en el modelo de energía local y el espacio-escala de la señal monogénica. Los resultados experimentales mostraron que el método propuesto es robusto a distorsiones geométricas, tipos de fuente, fondos complejos y cambios de iluminación. También, el método propuesto logró un alto desempeño en la tarea de segmentación de caracteres manteniendo un bajo número de componentes extraídos. El método superó los algoritmos del estado-del-arte en conjuntos de imágenes comunes en términos de segmentación de caracteres, localización de texto y número de regiones candidatas. Por otro lado, también se atacó el problema del reconocimiento de caracteres. Para este problema, se propuso un descriptor de características llamado LUIFT. Este descriptor y el modelo de bolsa de características fueron utilizados para la representación y clasificación de caracteres. El método sugerido mostró robustez a ligeras distorsiones geométricas, oclusión y degradaciones tales como iluminación no uniforme, ruido y baja resolución. Finalmente, se obtuvo un sistema completo de detección y reconocimiento de texto multi-orientado en imágenes naturales. El método propuesto fue evaluado utilizando...
Text detection and recognition in natural images refer to the process of text regions localization in real images, captured by a mobile device (smartphone, digital camera, electronic tablet, etc.), in order to convert the detected text into Unicode characters “understandable” for computers and/or to create editable text files. Natural scene text detection and recognition systems, have gained much attention from the computer vision community due to their contribution to multiple applications, such as document classification, multimedia retrieval, language translator, human-computer interaction, robotic navigation, and augmented reality. Unlike the images obtained by scanning with controlled conditions, natural images may be affected by various aspects of the environment (non-uniform illumination, shadows, scene complexity), image acquisition problems (low resolution, blurring, perspective distortion, occlusion), and the text content (orientation, size, fontstyle, texture, color), owing to the nature of a capture device. In order to solve the before said problems, in this thesis robust natural text detection and recognition methods are proposed. In other words, the work addresses the problem of detection and recognition of multi-oriented text, under non-uniform illumination, low resolution and presence of additive noise. Typewritten text is considered with different types of fonts and sizes as well as with simple and complex backgrounds. A new method based on the local energy model and the scale-space monogenic signal for multi-oriented text detection and segmentation was proposed. Experimental results show that the suggested method is robust to geometric distortions, complex backgrounds, and illumination variations. The method outperforms the state-of-art algorithms on common datasets for character segmentation and text localization. Also, the character recognition problem was attacked. For this problem, a feature descriptor referred to as LUIFT was proposed. The LUIFT descriptor and the BOF approach were used to represent and classify characters. The suggested method shows a robust performance to slight geometric distortions, occlusion, and degradations such as non-uniform illumination, noise and low resolution. Finally, the end-to-end system was designed and implemented for detection and recognition of text in natural images. The performance of the system was evaluated using common datasets and compared to the state-of-the-art techniques.
CICESE
2019
Tesis de doctorado
Español
Diaz Escobar, J. 2019. Desarrollo de un sistema de detección y reconocimiento de texto multi-orientado en imágenes naturales bajo iluminación no uniforme. Tesis de Doctorado en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California. 119 pp.
SISTEMAS DE RECONOCIMIENTO DE CARACTERES
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Descripción Tamaño Formato  
Tesis_Diaz-Escobar_Julia_11_feb_2019.pdfVersión completa de la tesis10.11 MBAdobe PDFVisualizar/Abrir