Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/2061
Análisis de transcriptomas para el descubrimiento de péptidos antimicrobianos
Analysis of transcriptomes for antimicrobial peptides discovery
GERMAN MELENDREZ CARBALLO
CARLOS ALBERTO BRIZUELA RODRIGUEZ
GABRIEL DEL RIO GUERRA
Acceso Abierto
Atribución
transcriptomas, RNA-Seq, péptidos antimicrobianos, programación paralela, aprendizaje de máquina
transcriptomes, RNA-Seq, antimicrobial peptides, parallel programming, machine learning
Ante la aparición cada vez más frecuente de enfermedades infecciosas producidas por bacterias resistentes a múltiples fármacos, el descubrimiento de antibióticos se está volviendo una necesidad urgente. Dada la complejidad del problema, se han empleado varios enfoques para abordarlo, siendo uno de ellos la identificación de péptidos antimicrobianos (AMP, AntiMicrobial Peptides); motivado principalmente por el uso frecuente observado en la naturaleza para combatir con ellos a diferentes microorganismos y porque presentan un amplio espectro de mecanismos de acción, lo que los convierte en una alternativa potencial a los antibióticos convencionales. Los péptidos antimicrobianos comúnmente se derivan de polipéptidos que son proteolizados y que se producen en organismos vivos cuando estos deben defenderse de microorganismos que son una amenaza para su sobrevivencia. Para abordar la identificación de péptidos antimicrobianos que pudieran producirse en la naturaleza para atacar a microorganismos, en este trabajo usamos datos de expresión de genes (transcriptomas) para identificar el posible proteoma que esté siendo expresado en un momento dado, y proponemos un nuevo enfoque basado en la proteólisis in silico, aplicando para esto un ventaneo a las secuencias del proteoma, descartando las ventanas redundantes por medio de algoritmos de ordenamiento y comparación lexicográfica. Las ventanas de secuencias resultantes son evaluadas usando técnicas de aprendizaje de máquina para su clasificación como antimicrobianas o no antimicrobianas. Manejar grandes cantidades de datos en un tiempo aceptable, como la demandada al trabajar con proteomas, requiere de la explotación de los recursos ofrecidos por los procesadores modernos. En este trabajo se realizó una implementación en paralelo del flujo de trabajo previamente descrito. Experimentos computacionales muestran que el diseño es capaz de analizar un proteoma de 16,037 secuencias, obteniendo un total de 243,643,492 k-meros únicos de entre 10 y 60 aminoácidos de longitud, en aproximadamente 7 horas.
Faced with the increasingly frequent occurrence of infectious diseases caused by bacterias resistant to multiple drugs, the discovery of antibiotics is becoming an urgent need. Given the complexity of the problem, several approaches have been used to address it. The identification of antimicrobial peptides (AMP, AntiMicrobial Peptides) is one of these approaches, motivated mainly by the frequent use of these molecules to fight different microorganisms and because they present a wide spectrum of mechanisms of action, which makes them a potential alternative to conventional antibiotics. Antimicrobial peptides are commonly derived from polypeptides that are proteolyzed and that are produced in living organisms when they must defend themselves against microorganisms that are a threat to their survival. To identify antimicrobial peptides that could occur in nature, in this work we analyze expression data (transcriptome) to search in the translated proteome that is being expressed at a given time and propose a new in silico proteolysis-based approach. To this aim we apply a sliding window to the proteome sequences, discarding redundant fragments of amino acids by using sorting algorithms and lexicographic comparison. The resulting non redundant sequences are evaluated using machine learning techniques to classify them as antimicrobial or non-antimicrobial. Handling large amounts of data in an acceptable time, such as the one demanded when working with proteomes, requires the exploitation of the resources offered by modern processors. In this work, a parallel implementation of the previously described workflow was carried out. Computational experiments show that the design is capable of analyzing a proteome of 16,037 sequences, obtaining a total of 243,643,492 unique k-mers between 10 and 60 amino acids of length, in approximately 7 hours.
CICESE
2018
Tesis de maestría
Español
Meléndrez Carballo, G. 2018. Análisis de transcriptomas para el descubrimiento de péptidos antimicrobianos. Tesis de Maestría en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California. 113 pp.
BIOLOGÍA MOLECULAR
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Descripción Tamaño Formato  
tesis_Melendrez_Carballo_Germán_20_feb_2018.pdfVersión completa de la tesis3.55 MBAdobe PDFVisualizar/Abrir