Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/2248
Evaluación y diseño de predictores de interacción miARN-proteína
Evaluation and Design of miRNA-protein interaction Predictors
NEPHTALI DICOCHEA MORENO
CARLOS ALBERTO BRIZUELA RODRIGUEZ
Acceso Abierto
Atribución
bioinformática, miARN, proteína, interacción, aprendizaje de máquina
Bioinformatics, miRNA, protein, interaction, machine learning
La estructura tridimensional de una proteína nos da una idea de su función biológica y de las posibles interacciones subyacentes con otras biomoléculas. Uno de los principales desafíos en los últimos años ha sido desentrañar las características ocultas que permiten y propician estas interacciones. Además, en las últimas dos décadas, con la creciente cantidad de datos de secuenciación de alto rendimiento se ha observado que el papel de las proteínas de unión a ARN (RBPs) implicadas en su procesamiento, es un factor clave en enfermedades mortales como el cáncer. Por lo tanto, tener un atlas completo de RBPs implicado en la vía de procesamiento del miARN se considera escencial. Además, con este propósito se han presentado enfoques con una amplia gama de técnicas, computacionales y de laboratorio húmedo, algunos de ellos con buenos resultados. En Sheng y Zhou (2013) se propone un modelo computacional para el problema de la clasificación de secuencias por su capacidad o no de acloparse a miARN. Siguiendo este modelo computacional, en esta tesis se analiza la eficacia de dos clasificadores basados en aprendizaje de máquina, uno basado en un esquema supervisado y el otro en uno semi-supervisado, los cuales podrían ser aplicados para identificar nuevas RBPs usando información de su estructura tridimensional. Así mismo, se comparan selectores de características con el propósito de mejorar la calidad de clasificación lograda en Sheng y Zhou (2013). Además de que los resultados experimentales de una combinación de datos, características y clasificador lograron mejorar todas las medidas de calidad de clasificación con respecto al trabajo de Sheng y Zhou (2013), en este trabajo se presenta evidencias de que un obstáculo prioritario que se debe resolver para avanzar en la predicción de RBPs es la escasez de ejemplos disponibles.
The three-dimensional structure of a protein gives us an insight into its biological function and about the possible underlying interactions with other biomolecules. One of the main challenges in the last few years has been to unravel the hidden features that allow and encourage these interactions. In addition, over the last two decades, with the increasing amount of high-throughput sequencing data, it has been observed that the role of RNA-binding proteins (RBPs) involved in miRNA’s processing is a key factor in deadly diseases such as cancer. Therefore, having a complete atlas of RBPs involved in the processing of the miRNA is considered essential. In addition, with this purpose, approaches have been presented on a wide range of technical, computational and laboratory techniques, some of them with good results. Sheng and Zhou (2013) proposed a computational model for the classification problem of sequences according their ability to bind to miRNAs. Following this computational model, this thesis analyzes the effectiveness of two classifiers based on machine learning, one based on a supervised scheme and the other on a semi-supervised one, which could be applied to identify new RBPs using information from their three-dimensional structure. Likewise, feature selectors are compared with the purpose of improving the classification quality achieved in Sheng and Zhou (2013). In addition to the experimental results of a combination of data, features, and classifier, that show that all classification quality measures were improved with respect to Sheng and Zhou (2013), in this work we present evidence that a key obstacle that must be solved in order to advance in the prediction of RBPs is the lack of available examples.
CICESE
2018
Tesis de maestría
Español
Dicochea Moreno, N. 2018. Evaluación y diseño de predictores de interacción miARN-proteína. Tesis de Maestría en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California. 68 pp.
INTELIGENCIA ARTIFICIAL
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Descripción Tamaño Formato  
Dicochea.pdfVersión completa de la tesis2.28 MBAdobe PDFVisualizar/Abrir