Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/3044
Clasificación del audio cardiaco mediante representación escasa de señales y aprendizaje automático
Cardiac audio classification by sparse signal representation and automatic learning
JAVIER IVAN GUTIERREZ URIBE
MIGUEL ANGEL ALONSO AREVALO
Acceso Abierto
Atribución
Codificación escasa, aprendizaje máquina, Señales de audio cardiaco, procesamiento de señales, clasificación, Matching Pursuit
Sparse coding, machine learning, heart sound signals, signal processing, classification, Matching Pursuit
Las principales causas de muerte alrededor del mundo son las enfermedades cardiovasculares (CVDs). El fonocardiograma (PCG) es la herramienta más simple, de bajo costo y ampliamente utilizada para ayudar a los fisiólogos en el diagnóstico de CVDs. Investigaciones en el procesamiento de señales y Machine Learning han tenido resultados prometedores en el área de la clasificación de audio cardiaco, motivando a aún más investigaciones. En este trabajo, se propone un esquema de clasificación de audio cardiaco para la detección de la presencia/ausencia de un estado patológico utilizando características tiempo-frecuencia de tipo sparse, específicamente funciones de Gabor, y el análisis de su residual; predicción lineal, características en el dominio de tiempo, características en el dominio de la frecuencia, coeficientes cepstrales en la escala de frecuencias Mel y su velocidad. Cada uno de estos fue probado con 9 clasificadores, utilizando una base de datos que contiene 2,873 PCGs previamente segmentados, la cual fue utilizada para crear una base de datos balanceada de 740 PCGs (600 para entrenar al clasificador y 140 para prueba) utilizando submuestreo aleatorio. El clasificador de bosques aleatorios tuvo el mejor rendimiento, y fue utilizado para clasificar el vector completo de todas las 300 características. Posteriormente, se implementó reducción de la dimensionalidad para disminuir el vector de características a 60, con análisis de componentes principales (PCA-60) y evaluación de la importancia de las características (RF-60); resultando en que RF-60 tenía mejor desempeño. El algoritmo propuesto mostró un rendimiento de SP=0.87, SE=0.798 y MAcc=0.834 en términos de specificity, sensitivity y modified accuracy. Además, este algoritmo, fue probado utilizando la base de datos desbalanceada que cuenta con 2,873 PCGs mostrando un desempeño de SP=0.974, SE=0.780 y MAcc=0.877.
The main cause of death worlwide are the cardiovascular diseases (CVDs). Phonocardiogram (PCG) is the most simple, low cost and highly used tool to assist physicians in diagnosing CVDs. Researches in signal processing and machine learning have had promising results in the area of heart sound signal classification, and motivated even more researches. In this work, we propose a heart sound classification scheme to detect the presence/absence of a pathological state using sparse time-frequency features, specifically Gabor wavelets, and its residual analysis; linear predictive, time domain features, frequency domain features , Mel-frequency cepstral coefficients and its velocity. Each one of these were tested with 9 classifiers, using a database containing 2,873 PCGs previously segmented, which was used to create a balanced dataset of 740 PCGs (600 for train the classifier and 140 for testing) using random undersampling. The random forest classifier had the best performance, and was used to classify the complete vector of all the 300 features. Then principal components analysis and an evaluation of the feature importance were used to decrease the dimensionality of the features vector to 60; having this the best performance. The proposal showed performances of SP=0.87, SE=0.798 and MAcc=83.4 in terms of specificity, sensitivity and modified accuracy. Also, the whole unbalaced dataset containing 2,873 PCGs was tested showing a performance of SP=0.974, SE=0.780 and MAcc=0.877.
CICESE
2019
Tesis de maestría
Español
Gutiérrez Uribe, J.I. 2019. Clasificación del audio cardiaco mediante representación escasa de señales y aprendizaje automático. Tesis de Maestría en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California. 66 pp.
TECNOLOGÍA DE LAS TELECOMUNICACIONES
Aparece en las colecciones: Tesis - Electrónica y Telecomunicaciones

Cargar archivos:


Fichero Descripción Tamaño Formato  
tesis Gutiérrez Uribe Javier Iván_25_nov_2019.pdfVersión completa de la tesis1.44 MBAdobe PDFVisualizar/Abrir