Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/3466
Clasificación multiclase de péptidos antimicrobianos: un enfoque comparativo
Multi-class classification of antimicrobial peptides: a comparative approach
SERGIO ALEJANDRO PINACHO CASTELLANOS
Carlos Alberto Brizuela Rodríguez
CESAR RAUL GARCIA JACAS
Acceso Abierto
Atribución
aprendizaje de máquina, aprendizaje profundo, clasificación multiclase, péptidos antimicrobianos, selección de características
antimicrobial peptides, feature selection, deep learning, machine learning, multi-class clasification
La continua proliferación de agentes infecciosos capaces de resistir a los fármacos antimicrobianos, existentes en el mercado, se ha convertido en una de las mayores preocupaciones para la salud pública mundial. Los péptidos antimicrobianos (AMPs, por sus siglas en inglés) han ganado popularidad al considerarse candidatos prometedores para usarse solos o en combinación con los fármacos actuales para hacer frente a la resistencia antimicrobiana. Para asistir a la investigación y descubrimiento de nuevos AMPs con potencial uso terapéutico, se han propuesto modelos computacionales basados en algoritmos clásicos de aprendizaje de máquina. Un problema con estos modelos radica en que el costo computacional para la selección de un conjunto óptimo de descriptores moleculares, para representar los datos, crece exponencialmente con el número de descriptores disponibles inicialmente para la selección. Recientemente, modelos computacionales basados en redes neuronales de múltiples capas (conocidos como modelos profundos) mostraron que es posible eliminar la tarea de seleccionar características a priori, con un buen desempeño en la predicción de AMPs. En el presente trabajo, se propone un conjunto de datos para cada una de las actividades biológicas estudiadas, la más grande y diversa colección reportada a la fecha. Se usa el algoritmo de bosque aleatorio para construir modelos clásicos de clasificación. Se propone una red neuronal de múltiples capas con unidades recurrentes para construir modelos profundos. Los experimentos computacionales mostraron que los clasificadores propuestos en este trabajo, para cada actividad biológica, tienen un desempeño de comparable a superior respecto a los métodos del estado del arte. Por otra parte, se comparó el desempeño de modelos clásicos y profundos para el problema de clasificación de AMPs y las funciones atribuidas a estos, específicamente las funciones antibacteriana, antifúngica, antiparasitaria y antiviral. Los resultados mostraron que no existe una clara superioridad en el desempeño de un modelo con respecto al otro.
The increasing proliferation of infectious agents capable of resisting antimicrobial drugs constitutes a grave problem for human health worldwide. Antimicrobial peptides (AMPs) have gained popularity as promising candidates for use alone or in combination with current therapies to address antimicrobial resistance. To tackle the problem of discovering new AMPs with potential therapeutic use, computational models based on classical machine learning algorithms (known as shallow models) have been proposed. One problem with these models is that the computing cost of selecting a set of molecular descriptors to represent the data grows exponentially with the number of descriptors initially available for selection. Recently, computational models based on multi-layer neural networks (known as deep models) showed that the task of selecting features a priori could be eliminated, maintaining good performance in the prediction of AMPs. In this work, data sets were proposed for each of the studied biological activities, the largest and most diverse reported to date. The random forest algorithm was used to build shallow models. A multi-layer neural network with recurrent units was proposed to build deep models. Computational experiments showed that the proposed classifiers, for each biological activity, have a performance that goes from comparable to superior with respect to state of the art approaches. Additionally, shallow and deep models’ performance was compared, addressing the problem of Classification of AMPs and the functions attributed to them, specifically the antibacterial, antifungal, antiparasitic and antiviral functions. The results showed no clear superiority in the performance of the deep models as compared to the shallow models or vice versa.
CICESE
2021
Tesis de maestría
Español
Pinacho Castellanos, S.A. 2021. Clasificación multiclase de péptidos antimicrobianos: un enfoque comparativo. Tesis de Maestría en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California. 96 pp.
INTELIGENCIA ARTIFICIAL
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Descripción Tamaño Formato  
Tesis_Sergio Alejandro Pinacho Castellanos_04 marzo 2021.pdfVersión completa de la tesis3.4 MBAdobe PDFVisualizar/Abrir