Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/449
Identificación in silico de sitios catalíticos en estructuras tridimensionales de proteínas
In silico Identi?cation of catalytic sites in three-dimensional structures of proteins
David Israel Flores Granados
Carlos Alberto Brizuela Rodríguez
Acceso Abierto
Atribución
Residuos catalíticos
Las proteínas son unas de las macromoléculas más abundantes en los organismos, las funciones que realizan son muy diversas: catálisis, reconocimiento inmune, adherencia celular, transducción de señales, transporte, movimiento y organización celular. La inferencia automática de funciones para proteínas es un reto vigente en la bioinformática estructural. Una línea de investigación para tal propósito es la identi?cación de residuos catalíticos. Los métodos desarrollados para estas tareas y que están basados en secuencias son la elección natural cuando las proteínas de consulta tienen un alto porcentaje de identidad con enzimas bien anotadas. Sin embargo, cuando la homología no es aparente, lo cual ocurre con un gran número de estructuras de la iniciativa del genoma estructural, entonces la información basada sólo en la secuencia es insu?ciente, haciéndose necesario el uso de información proveniente de la estructura tridimensional de las proteínas. En esta investigación se analizó un método para la predicción de residuos catalíticos denominado CMASA, el cuál se basa en comparaciones de estructuras locales. El método alcanza valores altos en: exactitud, precisión y coe?ciente de correlación de Matthews; sin embargo, ante la presencia de mutaciones puntuales o ausencia de datos relevantes, dichas medidas de desempeño se ven afectadas fuertemente. Para atacar dicho deterioro del desempeño de CMASA, este trabajo propone extender la biblioteca de plantillas de CMASA, de tal forma que se incluyan patrones de menor tamaño con la capacidad de absorber las mutaciones o datos faltantes. Numerosos experimentos computacionales se realizaron con casos como pruebas de concepto, al igual que para un par de casos reales. Los resultados obtenidos indican que la extensión se desempeña adecuadamente cuando un sitio catalítico potencial contiene un residuo mutado o cuando un residuo o sus átomos no están presentes. La extensión propuesta pudo predecir correctamente los residuos de un mutante de timidilato sintetasa, 1EVF. También predice correctamente los residuos catalíticos para la glutaredoxina de plantas (3RHC) a pesar de que carece de información relevante en un átomo de la cadena lateral en el archivo PDB. Otra parte importante de esta investigación se centró en el análisis para la identi?cación funcional de un grupo de proteínas pertenecientes a la clase de las cinasas; el estudio evaluó distintas representaciones estructurales con enfoques tanto globales como locales. Los resultados preliminares de esta evaluación muestran el alto grado de complejidad que implica encontrar una representación estructural capaz de discriminar a los elementos de la superfamilia de las cinasas.
Proteins are one of the most abundant macromolecules in organisms, the functions they perform are very diverse: catalysis, immune recognition, adhesion cellular, signal transduction, transport, movement and cell organization. Automatic inference of function protein is acurrent challenge instructural bioinformatics. A line of research for this purpose is the identi?cation of residues catalytic. The methods developed for this task and based on sequences, are the natural choice when the proteins for queries with a high percentage of identity with enzymes well annotated. However when the homology is not apparent, which occurs with many structures from the structural genome initiative, structural information should be exploited. This research was analyzed a method for prediction of catalytic residues, called CMASA. This method is based on comparisons of local structures, reaching highvalues:accuracy, precision and Matthews correlation coef?cient. However, in the presence of point mutations or absence of relevant data, these performance measures are affected strongly. To overcome performance degradation of CMASA, this work proposes to extend the template library CMASA, so that smaller patterns are included, with the ability to absorb mutations or missing data. Extensive computational experiments are shown as proof of concept instances, as well as for a few real cases. The results show that the extension performs well when the catalytic site contains mutated residues or when some residues are missing. The proposed modi?cation could correctly predict the catalytic residues of a mutant thymidylate synthase, 1EVF. It also successfully predicted the catalytic residues for 3HRC despite the lack of information for a relevant side chain atom in the PDB ?le. Another important part of this research focused on the analysis for the identi?cation a functional group of proteins belonging to the class of kinases; the study evaluated different structural representations with both global and local approaches. Preliminary results of this evaluation show the high degree of complexity for ?nding a structural representation capable to discriminate elements belonging to the kinase superfamily.
CICESE
2015
Tesis de doctorado
Español
Flores Granados,D.I.2015.Identificación in silico de sitios catalíticos en estructuras tridimensionales de proteínas.Tesis de Doctorado en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California.xii, 115 pp.
CIENCIA DE LOS ORDENADORES
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Descripción Tamaño Formato  
239911.pdfVersión completa de la tesis5.51 MBAdobe PDFVisualizar/Abrir