Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/380
Atención visual integrando el paradigma de potencialidades en función de la distancia
Visual attention that integrates the paradigm of affordances as a function of distance
Luis Arturo Guerra García
Josefina Rodriguez Jacobo
Acceso Abierto
Atribución
Imagen
El concepto de potencialidades, la gama de posibles acciones que un organismo percibe visualmente de los objetos, ha sido adoptada con interés por parte de la comunidad de visión arti?cial. Además de proponer otro camino para comprender el proceso de visión, la idea ha mostrado ser versátil, lo que permite su aplicación en distintas formas, ya sea como agente principal para la solución de un problema de visión, o como parte de un sistema que lo utiliza en conjunto con otros modelos. El presente trabajo de investigación propone integrar dicho concepto al modelo de ruta dorsal arti?cial (ADS), el cual, combina las dimensiones de forma, color, orientación e intensidad de la imagen capturada para producir un foco de atención. La ruta dorsal biológica utiliza más dimensiones, y una de ellas es la distancia; la información de esta dimensión permite realizar las tareas visomotoras (tarea importante de dicha ruta), por lo tanto, se considera necesario integrarla a la ADS. Para ello, se propone el paradigma de potencialidades en función de la distancia, idea que establece el propósito y la forma de dicha integración. El entrenamiento del sistema propuesto se realiza de dos formas: con una base de imágenes, y “en vivo”. Este último utiliza sólo las imágenes capturadas durante el entrenamiento.Los experimentos muestran que la integración de la distancia a la ADS mejora la capacidad de detección, especialmente, en la capacidad de ubicar el punto de foco de atención dentro del objeto. Dicho punto es indispensable para la ubicación correcta del objeto en el espacio. También se implementa con éxito la automatización para crear las imágenes de entrenamiento; un paso básico para el entrenamiento en vivo, y bené?co para el entrenamiento con base de imágenes. Sin embargo, el método de entrenamiento en vivo muestra una serie de problemas que necesitan ser resueltos antes de poder producir los resultados deseados.
The concept of affordances, the range of possible actions that an organism can perceive visually from objects, has been taken with interest by the computer vision community. Besides proposing a different way to understand the vision process, the idea has shown to be versatile, which allows to use the concept in a variety of ways, whether as the main agent for the solution of a computer vision problem, or as a component of a system that applies it together with other models. With this research, we propose to integrate the concept of affordances with the arti?cial dorsal stream model (ADS). The ADS combines the dimensions of shape, color, orientation and intensity from the captured image to produce a focus of attention. The biological dorsal stream includes more dimensions, one of them being the distance; the information of this dimension allows to perform visuomotor tasks (a main task of the dorsal stream), so we believe it is necessary to add it to the ADS. To accomplish this, we propose the paradigm of affordances as a function of distance, which states the purpose and form of this integration.The training phase of the proposed system is executed in two ways: one with an image database, the other with a “live” training. The latter only uses the images that the system captures during the training phase. The experiments show that the ADS improves its detection capabilities with the addition of distance information. Its capability to place the point of focus of attention on the object showed a good improvement. This point is critical for the correct location of an object in space. We successfully automated the process to create training images; this is a basic step for the “live” training, and it’s bene?cial for the image database training as well. Nevertheless, the live training method itself showed various problems that we need to solve before said method can produce the desired results.
CICESE
2016
Tesis de maestría
Español
Guerra García,L.A.2016.Atención visual integrando el paradigma de potencialidades en función de la distancia.Tesis de Maestría en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California.xxvii, 180 pp.
CIENCIA DE LOS ORDENADORES
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Descripción Tamaño Formato  
244821.pdfVersión completa de la tesis3.64 MBAdobe PDFVisualizar/Abrir