Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/3025
Clasificación de ladridos de perros domésticos usando aprendizaje profundo
Classification of domestic dog vocalizations using deep learning
JOSE RAMON GOMEZ ARMENTA
José Alberto Fernández Zepeda
Humberto Pérez Espinoza
Acceso Abierto
Atribución
aprendizaje Profundo, red neuronales, hiper-parametros
deep learning, neural networks, hyper-parameters
Esta investigación se sitúa dentro del campo de análisis inteligente de audio. En este campo se busca desarrollar métodos computacionales que puedan ser útiles para resolver diferentes problemas de interés; en particular, en este trabajo se estudia la clasificación de ladridos del perro doméstico. El método propuesto se desarrolló como una herramienta basada en el aprendizaje profundo que facilita la identificación del ladrido del perro y reconoce al individuo, especie, edad, sexo y contexto asociado a cada ladrido, con la finalidad de estimar información que aporte un perfil más amplio del animal. Esto puede ser de interés para las personas que trabajan y conviven con estos animales. Se construyeron cinco modelos distintos para cada una de las tareas de clasificación y la metodología se divide en 3 etapas: En la etapa de Preprocesamiento se utilizó la información de tres bases de datos. Se aplicaron técnicas para la preparación de los datos con el formato para cada uno de estos modelos. En la etapa de caracterización. Se evaluaron distintas técnicas para seleccionar la técnica de mejor desempeño, con las que se extrajeron los atributos más importantes y se prepararon los datos para la siguiente etapa. En la tercera etapa de clasificación. Se entrenó una red neuronal profunda para cada modelo, se evaluaron distintas arquitecturas de redes neuronales para seleccionar las más adecuada y se afinaron los hiperparámetros para cada modelo. En esta investigación se concluyen cuáles fueron las características más relevantes que se extrajeron de las bases de datos y la arquitectura de red neuronal profunda más adecuada para ese tipo de características, además de el método para encontrar la mejor combinación de hiper-parámetros.
The research done in this investigation corresponds to the field of intelligent audio analysis, applying a deep learning approach to distinct properties of sounds that may be useful to solve different tasks of classification for domestic dog vocalizations. The proposed method was developed as a tool that helps the identification of the dog’s bark and recognizes the identity, breed, age, sex and context associated with each bark, in order to estimate information that provides a broader profile of the animal, this may be of interest to people who work and interact with these animals. Five different models are constructed for each of the classification tasks, and the methodology is divided into three stages: In the preprocessing stage, a combination of three data-bases are used, all the similar tags for each task are joined together, then processing techniques were applied to prepare the data in the appropriate format for each of the se models. In the stage of characterization, different techniques are evaluated, where the best performance technique is selected, the most important attributes are extracted and the data is prepared for the next stage. In the stage of classification, each classification model is trained selecting the best hyper-parameters search for each model. Once the model is tuned and trained, the final prediction results are achieved. This investigation concludes with the most relevant characteristics extracted from the databases and the most appropriate deep neural network architecture for that type of characteristics, in addition to the method to find the best combination of hyper-parameters. This method is an effective proposal with outstanding performance and is in the state of the art, regarding the problem of barking classification, providing results that surpass previous investigations and classifying additional tasks that were not included before.
CICESE
2019
Tesis de maestría
Español
Gómez Armenta, J.R. 2019. Clasificación de ladridos de perros domésticos usando aprendizaje profundo. Tesis de Maestría en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California. 92 pp.
INTELIGENCIA ARTIFICIAL
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Descripción Tamaño Formato  
Tesis_Gomez_Armenta_José Ramon_15_nov_2019.pdfVersión completa de la tesis4.53 MBAdobe PDFVisualizar/Abrir