Please use this identifier to cite or link to this item: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/393
Reconocimiento de contexto usando información auditiva
Context recognition using auditory information
Jessica Beltrán Márquez
Edgar Leonel Chávez González
Jesus Favela Vara
Acceso Abierto
Atribución
Ciencias computacionales
La información que provee el contexto puede utilizarse para desarrollar aplicaciones dedicadas al cuidado de adultos mayores. Por ejemplo, para brindar asistencia en sus actividades de la vida diaria, fomentar su integración social y desarrollar estrategias para disminuir riesgos provocados por algunos medicamentos. Para obtener información del contexto se pueden utilizar diferentes sensores. En particular, la captura y el análisis del audio tienen la ventaja de proveer ?exibilidad para la recolección de datos ya que los micrófonos están embebidos en dispositivos móviles. Los retos que presenta el reconocimiento del contexto usando audio son la existencia de sonidos traslapados, las diferencias entre sonidos de un mismo tipo, el ruido y las limitaciones de espacio y tiempo de procesamiento. Los métodos existentes permiten reconocer eventos de sonidos cuando están grabados sin que exista traslape con otros sonidos. Recientemente se han propuesto métodos que son capaces de identi?car sonidos aunque estén mezclados con ruido de fondo, siempre que se pueda modelar el ruido a priori. En esta tesis, se presenta una representación del audio diseñada para reconocer eventos de sonidos ambientales sin necesidad de modelar el ruido de fondo. El método propuesto consiste en extraer características de las bandas de frecuencia de los sonidos a nivel de trama y posteriormente obtener la primera y segunda derivada en cada una de las bandas. La representación ?nal está formada por un conjunto de histogramas, uno por cada banda. Nuestra propuesta tiene la ventaja de ser ligera tanto en su cálculo como en su representación ?nal. Se muestra evidencia experimental que avala la e?ciencia del esquema para el reconocimiento de sonidos ambientales y se compara contra el único trabajo con un enfoque similar al nuestro que considera la misma restricción de no conocer a priori el ruido de fondo. Los resultados obtenidos mejoran en velocidad, precisión y exhaustividad a los métodos en el estado de arte. También se presentan evaluaciones sobre dos casos de uso relacionados con aplicaciones dirigidas al apoyo de adultos mayores cuyos resultados indican evidencia de su e?cacia para usar el reconocimiento automático de sonidos como herramienta. Además, se describe el uso del análisis del audio para desarrollar soluciones en escenarios distintos a la asistencia de adultos mayores.
The information given by the context can be used to develop applications to support older adults. For example, by providing assistance in their daily activities, by increasing their social interaction and by providing strategies to decrease the risk produced by some medications. Different types of sensors can be used to obtain the context information. Particulary, the capture and analysis of audio has the advantage of ?exibility in data collection and that microphones are included in mobile devices like smart phones. The challenges of context recognition through audio are the presence of mixed sounds in nature, the differences between sounds from the same class, the noise and the limitations of space and processing time. The current techniques allow classify sound events when they were captured with no overlap with other sounds. Recently, new methods have been proposed that are capable to identify sounds even if they are mixed with background noise, however a priori noise model in necessary. In this thesis, we present the development of a method for sound representation and classi?cation designed to recognize environmental sound events without modelling the background noise. Our proposal consist ?rst in the extraction of features in the frequency bands from the audio frames. Then, we obtain the ?rst and second derivative in each of the bands to ?nally represent the sounds through a set of histograms, one for each band. Our proposed method has the advantage of being light and easy to calculate. We show experimental evidence that validates the ef?ciency of the method to recognize sounds events and we compare against the only approach that considers the same restriction of not modelling a priory the background noise. The results in the experiments how an improvement in the processing times, precision and recall compared with the state of the art techniques. Also, we present evaluations over two use cases related with applications to support older adults, which provides evidence of its ef?cacy for automatic recognition of sounds as a tool for this purpose. Finally, we describe the use of audio analysis to develop solutions in different escenarios besides the support of older adults.
CICESE
2015
Tesis de doctorado
Español
Beltrán Márquez,J.2015.Reconocimiento de contexto usando información auditiva.Tesis de Doctorado en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California.xii, 124 pp.
CIENCIA DE LOS ORDENADORES
Appears in Collections:Tesis - Ciencias de la Computación

Upload archives


File Description SizeFormat 
242761.pdfVersión completa de la tesis2.27 MBAdobe PDFView/Open