Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/2458
Encadenamiento de algoritmos para mejorar métodos de búsqueda de motivos en secuencias de ADN
A pipeline for the improvement of motif finding methods in DNA sequences
Mauricio Antonio Chalita Williams
Carlos Alberto Brizuela Rodriguez
Acceso Abierto
Atribución
ADN,Algoritmos,Factores de transcripción
En esta tesis se describe una propuesta de solución para el problema de la búsqueda de motivos en secuencias de ADN. Los motivos son pequeños fragmentos de ADN los cuales están ubicados en la región promotora del gen. Estos fragmentos son sitios de acoplamiento de proteínas llamadas factores de transcripción las cuales permiten que se comience o se inhiba la transcripción de un gen. Debido a la complejidad de este problema, se han propuesto diferentes modelos y algoritmos para poder abordarlos. En este trabajo se propone utilizar un encadenamiento de algoritmos de búsqueda de motivos para atacar este problema y mejorar la exactitud de predicción de los algoritmos que lo componen. El encadenamiento RM+BP+MM consiste en pre-procesar los casos de prueba con RepeatMasker, para remover secuencias irrelevantes, seguido de BioProspector, el cual es utilizado para limitar el espacio de búsqueda que MEME realiza para la búsqueda de motivos. El encadenamiento RM+BP+WR+MM preprocesa la información de la misma manera, mientras que para limitar el espacio de búsqueda de MEME, utiliza Weeder y BioProspector simultáeamente. Se utilizó el benchmark propuesto por Tompa et al. (2005), que consiste en casos de prueba reales de organismos eucariotas (humano, ratón, mosca y levadura). Resultados computacionales muestran que el encadenamiento de algoritmos propuesto puede mejorar la búsqueda de motivos. Ambos encadenamientos propuestos (RM+BP+MM y RM+BP+WR+MM), mejoraron los resultados de los algoritmos que los componen. RM+BP+MM obtuvo la sensibilidad, rendimiento y especificidad más alta en comparación con Weeder, MEME y BioProspector, mientras que RM+BP+WR+MM únicamente superó en sensibilidad y rendimiento a los algoritmos anteriores.
In this work we present two pipelines for the motif finding problem. Motifs are small fragments of DNA located in the gene promoter region. These fragments are binding sites for proteins known as transcription factors which are involved in the gene regulation process. Due to the complexity of this problem, many models and algorithms to solve them have been proposed. This paper proposes the use of pipeline algorithms to attack this problem and improve the accuracy of prediction of the component algorithms. The RM+BP+MM pipeline preprocesses the data sets with RepeatMasker to remove irrelevant sequences, followed by BioProspector, which is used to limit the search space that MEME explorea for the motif search. The RM+BP+WR+MM pipeline preprocesses the data sets in the same way, while BioProspector and Weeder are used simultaneously in order to reduce the search space for MEME. Tompa’s et al.(2005) benchmark was used, it consists of several real instances of eukaryotic organisms (human, mouse, fruit fly and yeast). In this work, it is shown that pipeline algorithms can improve the search for motifs. Both proposed pipelines (RM+BP+MM y RM+BP+WR+MM), improved the results of the component algorithms. RM+BP+MM obtained better sensitivity, specificity and performance against Weeder, MEME and BioProspector, while RM+BP+WR+MM only obtained better sensitivity and performance against the previous algorithms.
CICESE
2011
Tesis de maestría
Español
Chalita Williams, Mauricio Antonio.2011.Encadenamiento de algoritmos para mejorar métodos de búsqueda de motivos en secuencias de ADN.Tesis de Maestría en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California.xiv, 169 hojas
TECNOLOGÍA DE LOS ORDENADORES
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Tamaño Formato  
187831.pdf5.16 MBAdobe PDFVisualizar/Abrir