Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/374
Síntesis de operadores sobre imágenes para estimar la trayectoria de una cámara, usando programación genética
Synthesis of image operators for trajectory estimation of a camera using genetic programming
Daniel Eduardo Hernández Morales
GUSTAVO OLAGUE CABALLERO
Acceso Abierto
Atribución
Detector de puntos de interés,SLAM,Marcadores Visuales,Programación genética,Optimización multi-objetivo
El uso de sistemas de visión en robótica se puede ver como una tendencia natural,ya que hoy en día son un tipo de sensores que brindan información del ambiente que esomnipresente. Una de las herramientas más utilizadas en diferentes problemas de visiónes la detección de regiones interesantes en la imagen. El concepto básico de esta áreade investigación es el estudio de los detectores de puntos de interés; los cuales son algoritmosque extraen puntos prominentes en la imagen. Estos algoritmos consideran unoperador que actúa sobre la imagen para definir qué regiones son interesantes. Algunasde las aplicaciones de los puntos de interés son: la detección de esquinas, detección decontornos, reconocimiento de objetos basado en visión, correspondencia entre imágenes,por mencionar solo algunas. Así, sin importar cual sea la aplicación que se les dará, todoslos detectores de puntos de interés funcionan en tres etapas básicas: una operaciónsobre la imagen para lograr una imagen de interés, después se realiza un proceso desupresión de no máximos, y por último un umbralizado para definir que puntos en laimagen son interesantes. La mayoría de los detectores del estado del arte usan métodossimilares para las últimas dos etapas. Sin embargo, la etapa principal que define elfuncionamiento de un detector incluye lo que llamamos un operador el cual se usa paraobtener la imagen de interés. Las técnicas tradicionales no consideran ninguna estrategiapara diseñar detectores que sean concebidos para resolver tareas específicas. Enesta tesis, se propone generar operadores que detectan puntos de interés basándonosen una nueva metodología, la cual consiste en el análisis de las imágenes que se evolucionaránde acuerdo a una aplicación propuesta de seguimiento de características; lacual una vez implementada permitirá generar detectores especializados de forma automática.En este trabajo, se utilizó la técnica evolutiva conocida como ProgramaciónGenética (GP, por su siglas en inglés, “Genectic Programming”), la cual permite generarmodelos matemáticos de forma automática planteando el problema como un procesode optimización. De esta forma se pueden generar los operadores que serán utilizadosdentro de un detector de puntos de interés. El proceso de búsqueda es impulsado poruna función objetivo la cual mide el rendimiento del modelo en la aplicación en cuestión.En esta tesis se utilizan varias funciones objetivo para medir el rendimiento de los operadores desde diversas perspectivas. Esto nos lleva a un proceso de optimizaciónmulti-objetivo. Algo interesante de la aplicación que se estudia en este trabajo, es queva más allá de problemas de visión por computadora. El problema consiste en estimarla trayectoria de una cámara; así, este problema se basa en un problema muyconocido en robótica llamado Simultaneous Localization and Mapping (SLAM, por sussiglas en inglés). En nuestro trabajo se propuso una función que mide el rendimiento deun detector dentro de un sistema SLAM con visión monocular, llamado MonoSLAM.Esta función impulsa el proceso de búsqueda a fin de encontrar operadores que definen detectores de puntos de interés especializados en este problema. Los detectoresencontrados logran un rendimiento comparable a detectores del estado del arte, perosin usar rutinas innecesarias, lo que nos lleva a concluir que esta metodología demostrósu utilidad. Otro aspecto interesante de este trabajo es que normalmente se utilizanbases de imágenes con transformaciones sobre las imágenes las cuales son calibradas demanera muy cuidadosa por expertos. En lugar de esto, nosotros usamos una cámaramontada en un sistema robótico para capturar las imágenes en tiempo de ejecución, loque brinda un aspecto más realista a todo el proceso. Los resultados experimentalesilustran de manera clara y efectiva cómo los operadores evolucionados permiten unaejecución sin heurísticas ligadas al procesamiento de la imagen en el sistema SLAM.
The use of vision in robotics is a natural trend; because, nowadays cameras are a kindof sensors that bring omnipresent information from the environment. One of the mostused tool in computer vision problems is the detection of interest regions in an image.The basic concept of this research area is the study of interest points detection; whichare algorithms that extract prominent points within an image. These algorithms use anoperator that works over the image to define which regions are of interest. Some of theaplications of interest points are: corner detection, edge detection, vision based objectrecognition, image correspondance, to name but a few. So, no matter what applicationyou will be given, all interest point detectors work according to three basic steps: animage operation used to find the Interest Image; then, a non-maximum supressionmethod is applied; and finally, a threshold is used over the interest image to definewhich points are of interest. Most state-of-the-art interest point detectors use similarmethods for the last two steps. Nevertheless, the main step that defines a detectorincludes what we call an operator which is used to get the interest image. Traditionaltechniques do not consider an strategy to design detectors that solve an specific task.In this thesis, we propose to generate operators that detect interest points based ina new methodology, which consists on the analysis of the images that will evolvedaccording to a proposed application of feature tracking; which once implemented sucha metodology will allows us to generate specialized detectors automatically. In thisthesis, we use an evolutionary technique known as Genetic Programming, which allowsus to automatically generate mathematical models once the problem is defined in termsof an optimization process. In this way, we can generate image operators that willbe used within an interest point detector. This search process is driven by a fitnessfunction that measures the performance of a model within the proposed application.In this work, we use several fitness functions to measure the models from differentperspectives. This leads us to a multi-objective optimization framework. The problembeing studied in this thesis is the estimation of the trajectory described by a cameramounted on a robot manipulator. This work follows a very well-known problem inrobotics known as SLAM (Simultaneus Localization And Mapping). In our work, wepropose a function that measures the performance of a detector using a SLAM systemthat is based on monocular vision, which is called MonoSLAM. This function drives thesearch process to find operators that define interest point detectors specialized on thisproblem. The detectors thus found in this process achive performace comparable tothose published on the state-of-the-art but without some unnecessary artifacts, whichivleads us to conclude the usefulness of the proposed technique. Another interestingaspect of this work is that it uses real images captured in real time using a cameramounted on a robotic arm system, instead of using an image datebase, this brings amore realistic aspect to the methodology. The experimental results in this thesis showin a simple and efective way how the evolved operators allow us to execute the SLAMwithout using aditional and unnecessary heuristics linked to the image processing step. 
CICESE
2011
Tesis de maestría
Español
Hernández Morales,D.E.2011.Síntesis de operadores sobre imágenes para estimar la trayectoria de una cámara, usando programación genética.Tesis de Maestría en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California.xiv, 140 pp.
CIENCIA DE LOS ORDENADORES
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Descripción Tamaño Formato  
186711.pdfVersión completa de la tesis2.5 MBAdobe PDFVisualizar/Abrir