Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/3228
Predicción de regiones de cromatina abierta a partir del perfil de activación de la histona H3K27ac
Prediction of open chromatin regions from H3K27ac ChIP-Seq profiles
CESAR MIGUEL VALDEZ CORDOVA
ROSARIO IVETTH CORONA DE LA FUENTE
Carlos Alberto Brizuela Rodríguez
Acceso Abierto
Atribución
Epigenética, ChIP-seq, ATAC-seq, Accesibilidad de la Cromatina, SVM, clasificador binario
Epigenetics, ChIP-seq, ATAC-seq, Chromatin accessibility, SVM, binary classifier
En el contexto de la epigenética, la determinación de la estructura de la cromatina asociada a las modificaciones histonales y sus dinámicas asociadas es crucial para perfilar con precisión los fenómenos relacionados con procesos biológicos complejos, tales como, la diferenciación celular, el proceso de desarrollo celular y la aparicióny progresión de diversas enfermedades. La predicción de la estructura de la cromatina, y en particular, la identificación de los sitios accesibles de cromatina son problemas biológicos fundamentales que están siendo activamente investigados. En esta tesis, presentamos un clasificador binario, basado en una máquina de soporte vectorial (SVM), entrenado con datos disponibles de ChIP-sec y ATAC-sec derivados de experimentos relacionados con la modificación histonal H3K27ac. Nuestro modelo utiliza características construidas a partir de señales que se extraen directamente de los datos genómicos de acuerdo con una abstracción computacional basada en un fenomeno biológico, con el objetivo de determinar si es posible predecir sitios de ATAC-seq a partir de datos de ChIP-seq. Nuestro modelo con mejor desempeño puede identificar exitosamente el 82,84 % de los intervalos de ATAC-seq que coinciden con intervalos de ChIP-seq. Para la realización de las pruebas se desarrolló histoneSig, un paquete de R que está disponible en github para uso público. Si bien los resultados iniciales son prometedores, nuestro modelo aún necesita ser capaz de cuantificar y discernir el número de regiones asociadas y sus diferentes grados de accesibilidad. Idealmente, esto ayudará en el desarrollo de abstracciones biológicas cada vez más robustas, lo cual resultará en características más informativas y altamente generalizables.
In the context of epigenetics, determining chromatin structure associated to histonal modifications and its associated dynamics is crucial for accurately profiling phenomena related to complex biological processes, such as cellular differentiation, development and disease onset and progression. Prediction of chromatin structure, and in particular, the identification of accessible chromatin sites are fundamental, actively researched biological problems. In this thesis, we present a binary Support Vector Machine (SVM) classifier trained on openly available ChIP-seq and ATAC-seq data derived from experiments related to the H3K27ac histonal modification. Our model utilizes features constructed from signals that are extracted directly from genomics data in accordance with a computational abstraction that is based on a biological phenomenon, with the goal of determining if it is possible to predict ATAC-seq sites from ChIP-seq data. Our top performing model can successfully identify 82.84 %. of the ATAC-seq intervals that overlap with ChIP-seq intervals. To perform the various tests contained in this thesis, an R package, histoneSig, was developed. It is available on github for public use. While initial results are promising, our model still needs to be able to discern the number of associated regions and different degrees of accessibility. This will ideally aid in the development of increasingly robust biological abstractions, which will result in more informative, highly generalizable features.
CICESE
2020
Tesis de maestría
Español
Valdez Córdova, C.M. 2020. Predicción de regiones de cromatina abierta a partir del perfil de activación de la histona H3K27ac. Tesis de Maestría en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California. 80 pp.
OTRAS
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Descripción Tamaño Formato  
Tesis_Valdez Córdova César Miguel_19 feb 2020.pdfVersión completa de la tesis2.12 MBAdobe PDFVisualizar/Abrir