Please use this identifier to cite or link to this item: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/470
Correlación no lineal invariante a posición y rotación utilizando máscaras adaptativas binarias
Nonlinear correlation invariant to position and rotation usingbinary adaptive masks
Alfredo Solís Ventura
JOSUE ALVAREZ BORREGO
Acceso Abierto
Atribución
Correlación no lineal,Óptica Física,Macara binaria
En el reconocimiento de imágenes el desplazamiento o rotación de un objeto, dificulta o imposibilita su detección. En este trabajo se tiene como objetivo desarrollar un algoritmo digital que se ejecute con la mayor rapidez posible para el reconocimiento de imágenes, aun cuando estas presenten rotación, desplazamiento y contaminación por ruido, la transformada de Fourier de una imagen siempre estará centrada en el plano de frecuencias y es de esta manera que se logra obtener la invariancia a posición, para lograr la invariancia a rotación se proponen dos soluciones: la primera solución desarrollada, consta de una metodología iterativa, que cumple con invariancia a posición y rotación pero el tiempo de cómputo que utiliza es mucho y limita su aplicación práctica. Debido a esto se desarrolla una segunda metodología, que con la ayuda de una correlación no lineal adaptativa, logra la identificación de la imagen objetivo con un nivel de confianza del 100% y en un corto tiempo de cómputo utilizando una fracción de segundo por correlación. La metodología adaptativa se inicia tomando como referencia la parte real y positiva de la transformada de Fourier de una imagen objetivo, a partir de esta referencia se generan máscaras adaptativas binarias que son una serie de anillos concéntricos. Al realizar una multiplicación punto por punto de la máscara de anillos y el módulo de la transformada de Fourier de la imagen problema se obtienen una serie de anillos que contienen valores específicos del módulo de la transformada de Fourier. Estos anillos tienen la propiedad de ser invariantes a rotación. Al sumar los valores de cada anillo se obtiene una firma vectorial unidimensional capaz de representar a la imagen que se desea identificar, a pesar de estar desplazada, rotada e inmersa en ruido. Como método de comparación entre firmas vectoriales se utiliza una correlación no lineal, a la cual se le agrega la característica de ser adaptativa mediante un índice invariante a rotación, que se obtiene con una relación entre los promedios de la imagen problema y de la imagen objetivo, logrando así, la identificación automática de la imagen problema. Se demuestra la efectividad del método utilizando imágenes en blanco y negro, y en escala de grises; en donde cada una de ellas se gira grado por grado desde 0 hasta 359o. Fue posible identificar con éxito las 26 letras del abecedario en un formato blanco y negro y 19 especies de diatomeas fósiles en escala de grises, la identificación de diatomeas fósiles es de gran importancia para determinar las condiciones ambientales tanto del presente como del pasado y son útiles en estudios sobre la calidad del agua y el cambio climático. Se muestran resultados en donde se logra identificar con un nivel de confianza del 100% cada una de estas imágenes.  
Modifications due to displacement or rotation of an object to identify, adds difficulty or makes impossible the identification of the object. The objective is to develop a low computational cost digital algorithm to recognize images even when these images appear rotated, displaced and immersed in noise. The Fourier transform of an image, always will be centered on the frequency domain, and in this way, the invariant position is obtained. The first methodology developed consist of an iterative algorithm. This algorithm gets position and rotation invariance but it uses a lot of computational time. To avoid it; a second methodology was developed with the aid of an adaptive nonlinear correlation, achieving excellent results. The adaptive methodology begins taking as reference, the real and positive part of the target image Fourier transform. Starting in this reference, a binary adaptive mask was generated. This mask is a set of concentric rings. Calculating the point to point multiplication of the binary ring mask with the modulus of the Fourier transform of the problem image, we obtained a set of concentric rings, with the specific sampled values of the modulus of the problem image Fourier transform. These rings give us the property of rotation invariance. Making the sum of the values in each ring, we get a one-dimensional vectorial signature. This signature can represent a target image with invariance to rotation and position even in presence of noise. As comparison method between vectorial signatures, a nonlinear correlation was used. An adaptive characteristic was added to this nonlinear correlation with the aid of a rotational invariant index. This was obtained from a ratio between the mean values of the problem image and the target image, thus, the automatic identification of the problem image was achieved. The effectiveness of the method was demonstrated using black and white images and gray scale images. Each of these were rotated degree by degree from 0 to 359o. It was possible to identify with success the 26 letters of the alphabet in black and white format and 19 different fossil diatoms in gray scale format, the diatoms are a kind of microscopic algae and they are one of the most common types of phytoplankton. They live in fresh or marine water and are producers within the food chain. Hence, the diatom communities are used in the studies of water quality; also they are a useful tool for monitoring environmental conditions, past and present. Results with 100% of confidence level in the identification of these images are shown.
CICESE
2012
Tesis de maestría
Español
Solís Ventura, A.2012.Correlación no lineal invariante a posición y rotación utilizando máscaras adaptativas binarias.Tesis de Maestría en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California. 64 pp
ÓPTICA
Appears in Collections:Tesis - Óptica

Upload archives


File Description SizeFormat 
189201.pdfVersión completa de la tesis4.71 MBAdobe PDFView/Open