Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/366
Análisis comparativo de dos heurísticas para el problema de empaquetamiento de la cadena lateral en proteínas
Comparative analysis of two heuristics for the protein side chain packing problem
Rosario Ivetth Corona de la Fuente
CARLOS ALBERTO BRIZUELA RODRIGUEZ
Acceso Abierto
Atribución
Empaquetamiento de la cadena lateral,Estructura de proteínas,Biblioteca de rotámeros,plegamiento de proteínas
Actualmente, es más fácil determinar la secuencia de aminoácidos de una proteínaque la estructura de la misma, por lo que se intenta utilizar herramientas computacionalesque predigan la estructura a partir de la secuencia de aminoácidos. A esto se leconoce como el problema de predicción de estructuras de proteínas, el cual es uno delos problemas sin resolver más importantes en biología molecular y biocomputación.El problema de predicción de estructuras se puede dividir en varios subproblemas.Uno de ellos es el problema de empaquetamiento de la cadena lateral en proteínas(PSCPP, por sus siglas en inglés). Este problema consiste en determinar la conformaciónde la proteína conociendo, además de la secuencia de aminoácidos, la conformaciónde la columna vertebral de la misma.En este trabajo se presenta un análisis experimental comparativo entre los métodosSCWRL4 y OPUS-Rota, que a la fecha son los que presentan las soluciones con mejorexactitud. Estos métodos se componen de tres elementos principales: un algoritmode optimización, una función de energía que se desea minimizar, y una biblioteca derotámeros.Para hacer la comparación se propone un conjunto de casos de prueba con diferentescriterios que aseguran la buena calidad de los modelos del conjunto y, poder así, realizaruna comparación justa. Uno de estos criterios está relacionado con la clase de estructuraa la que pertenece la proteína siguiendo la clasificación conocida como SCOP. Además serelaciona el grupo al que pertenece cada proteína según una clasificación de propiedadesenzimáticas de las mismas. Esta clasificación se denomina EC (Enzyme Commission).Los métodos mencionados se han probado con anterioridad en casos específicos, bajodiferentes condiciones para cada algoritmo, por lo que es importante una comparaciónque permita evaluar el desempeño de ambos métodos en igualdad de circunstancias.Los resultados experimentales muestran que ambos métodos tienen un desempeñosimilar, tanto en calidad de soluciones como en tiempo de ejecución. En ambos casos,la calidad de la solución es poco sensible al tipo de estructura según la clasificaciónSCOP. Tampoco mostraron sensibilidad en función del grupo EC al que pertenecían lasproteínas. Sin embargo, ambos métodos se mostraron sensibles al tipo de aminoácido a predecir. En este sentido es más fácil predecir la estructura de aminoácidos comofenilalanina e isoleucina que aminoácidos tales como serina y ácido glutámico.El método OPUS-Rota, el cual está basado en recocido simulado, es más flexible en elsentido de que resulta fácil incluir otras funciones de energía y bibliotecas de rotámeros.Por esto se proponen algunas ideas para el diseño de un método de predicción deestructura basado en este algoritmo de optimización.
With the current technology it is easier to determine the amino acid sequence of aprotein than its structure, thus the importance of developing computational methodsand tools to predict the structure from the amino acid sequence. This prediction problemis known as the protein structure prediction and is one of the most important openproblems in molecular and computational biology.The problem of structure prediction can be divided into several subproblems. One ofthem is the protein side-chain packing problem (PSCPP), which consists in determiningthe protein structure knowing the amino acid sequence, and the conformation of thebackbone.We present a comparative experimental analysis of the methods SCWRL4 andOPUS-Rota, which are to date, the ones with more accurate solutions. These methodsconsist of three main components: an optimization algorithm, an energy function thatwe want to minimize, and a rotamer library.To make the comparison, a set of test instances is proposed based on differentcriteria, to ensure good sampling of all known structures and to make a fair comparison.One of these criteria is the class of structure to which it belongs, according to theclassification known as SCOP. Another criterion to classify the proteins is related tothe group to which each protein belongs according to the enzymatic properties it has.This classification is reffered to as EC (Enzyme Commission).The methods have been previously tested on specific instances, under different conditionsfor each algorithm, therefore a comparison is important to evaluate the performanceof both methods under the same conditions.The results show that both methods have similar performance, in the accuracy ofits solutions, and in the computation time. In both cases the quality of the solutionis not sensitive to neither the type of structure according to the SCOP nor to the ECclassification. However, both methods were sensitive to the type of amino acid. Inthis sense it is easier to predict the structure of amino acids such as phenylalanine andisoleucine than amino acids such as serine or glutamic acid.The method OPUS-Rota, which is based on simulated annealing, is more flexible, inthe sense that it is easy to include in this algorithm other energy functions and rotamerlibraries. Thus, we propose some ideas for designing a structure prediction methodbased on this optimization algorithm.
CICESE
2010
Tesis de maestría
Español
Corona de la Fuente,R.I.2010.Análisis comparativo de dos heurísticas para el problema de empaquetamiento de la cadena lateral en proteínas.Tesis de Maestría en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California.xii, 106 pp.
CIENCIA DE LOS ORDENADORES
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Descripción Tamaño Formato  
185611.pdfVersión completa de la tesis1.9 MBAdobe PDFVisualizar/Abrir