Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/2803
Métodos de selección óptima de descriptores moleculares para la clasificación de la actividad antimicrobiana y el diseño de nuevos péptidos
Methods for Optimal Selection of Molecular Descriptors for Antimicrobial Activity Classification and Design of New Peptid
Jesús Armando Beltrán Verdugo
Carlos Alberto Brizuela Rodríguez
Acceso Abierto
Atribución
Péptidos antimicrobianos, ponderación de características, descriptores moleculares, representación peptídica
Antimicrobial peptides, feature weighting, molecular descriptors, peptide representation
La resistencia a los antimicrobianos es un problema de salud mundial que pone en peligro el éxito del tratamiento de infecciones comunes. Los péptidos antimicrobianos (AMPs) son una alternativa prometedora para sustituir a los antibióticos convencionales en la lucha contra patógenos multirresistentes. Estos péptidos son parte del sistema de defensa innato de la mayoría de los organismos vivos, para muchos de los cuales se dispone de datos de sus transcriptomas. Sin embargo, considerando la vasta cantidad de datos transcriptómicos, el espacio de los péptidos sintetizables y la limitación práctica de la evaluación in vitro, descubrir nuevos AMPs se torna un desafío complicado. Motivado por este desafío la tesis aquí propuesta plantea utilizar estrategias computacionales para ayudar a descubrir y diseñar AMPs. Para poder identificar computacionalmente a los AMPs se requiere un conjunto apropiado de descriptores que ayuden a discriminar entre AMPs y no AMPs. Desafortunadamente, dado que existen miles de estos descriptores, una búsqueda exhaustiva de todas las combinaciones posibles es inviable. Por lo tanto, en este trabajo se proponen dos enfoques para seleccionar automáticamente los descriptores moleculares que representen a los péptidos para poder clasificarlos en AMPs y no AMPs. (i) Utilizar un filtrado basado en la ponderación de los descriptores, donde se asignen pesos a estos, de tal forma que secuencias AMPs tiendan a estar separadas de las que no son AMPs, mientras que las secuencias de AMPs tiendan a estar cercanas entre sí. (ii) Utilizar un enfoque de envoltura basado en un algoritmo genético donde cada péptido es representado por los descriptores seleccionados (i.e., con una longitud variable) y una función de aptitud que considera el coeficiente de correlación de Matthew de un clasificador inducido y el número de características seleccionadas. Los experimentos computacionales muestran que estos enfoques reducen sustancialmente el número de descriptores requeridos mejorando el rendimiento de clasificación con respecto al uso de todos los descriptores moleculares inicialmente disponibles. Además, el desempeño de los modelos generados es competitivo con las herramientas de predicción de AMPs disponibles actualmente. En particular, el enfoque basado en ponderación de características produce modelos de clasificación que superan a las herramientas disponibles para la clasificación específica de la actividad antibacteriana.
Antimicrobial resistance is a global health issue that compromises the effectiveness of current medical approaches on most common infections. Antimicrobial peptides (AMPs) are a promising alternative to conventional antibiotics in the fight against multi-resistant pathogens. These peptides are part of the innate defence system of most living organisms, for many of which transcriptome data are available. However, considering the vast amount of transcriptomic data, the space of synthesizable peptides and the practical limitation of in vitro evaluation, discovering new AMPs becomes a difficult challenge. Inspired by this challenge, this thesis proposes to use computational strategies to help in the discovering and designing of AMPs. To achieve this, an appropriate set of descriptors is required to help discriminate between AMPs and non-AMPs. Unfortunately, given that there are thousands of descriptors, an exhaustive search of all possible combinations is unfeasible. Therefore, in this work, we proposed two approaches to automatically select a peptide representation, based on molecular descriptors, that efficiently performs the classification between AMPs and nonAMPs. (i) Using a feature weighting approach, where each descriptor has an assigned weight, in such a manner that AMPs tend to be far away from non-AMPs, whereas AMPs tend to be close together. (ii) Using a wrapper approach based on a genetic algorithm, where each peptide is represented by the selected descriptions (i.e., a variable length representation) and a fitness function that considers the Matthew correlation coefficient of an induced classifier and the number of selected descriptors. Computational expe riments show that these approaches substantially reduce the number of descriptors, thus, improving the classification performance of the case where all initially available descriptors are used. Also, the performance of the generated models is competitive with the tools currently available for AMP clasification. In particular, the feature weighting approach produces classification models that outperform the tools available to classify antibacterial activity. Regarding the in silico design of AMPs, existing work mainly focuses on the exploration of peptide sequences close to known AMPs. Therefore, only a limited area over the entire molecular space is explored, causing poor diversity in the designed peptides...
CICESE
2019
Tesis de doctorado
Español
Beltrán Verdugo, J.A. 2019. Métodos de selección óptima de descriptores moleculares para la clasificación de la actividad antimicrobiana y el diseño de nuevos péptidos. Tesis de Doctorado en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California. 137 pp.
INTELIGENCIA ARTIFICIAL
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Descripción Tamaño Formato  
Tesis_vFinal_AR14Jun19.pdfVersión completa de la tesis6.87 MBAdobe PDFVisualizar/Abrir