Por favor, use este identificador para citar o enlazar este ítem: http://cicese.repositorioinstitucional.mx/jspui/handle/1007/1584
Calendarización de múltiples flujos de trabajo empleando estimaciones de tiempo de ejecución de usuario
Workflow scheduling of multiple workflows using user given runtime estimates
ADAN HIRALES CARBAJAL
Andrey Chernykh
Acceso Abierto
Atribución
Cómputo sobre grids,Administración de recursos,Flujo de trabajo
En esta tesis se presenta un estudio experimental de estrategias de calendarización determinísticas, sin interrupciones de múltiples flujos de trabajo para grids. Se estudian veinticinco estrategias que se distinguen por el tipo y la cantidad de información que requieren. Se analizan algunas estrategias de calendarización que consisten de dos y cuatro fases: etiquetado, asignación adaptativa, priorización y calendarización paralela. Aplicamos estas estrategias para la ejecución de los flujos de trabajo Cybershake, Epigenomics, Gnome, Inspiral, LIGO, Montage, y SIPHT. Con el fin de comparar el desempeño de las estrategias, se realizó un análisis usando un conjunto de tres métricas. Se presenta un estudio de caso. Los resultados indican que algunos algoritmos bien conocidos diseñados para la calendarización de grafos acíclicos dirigidos únicos sobre máquinas independientes son inadecuados para la calendarización sobre grids, donde las estimaciones de tiempo de ejecución están disponibles. Se muestra  que las estrategias propuestas mejoran el desempeño de estrategias previas en términos del factor de aproximación, tiempo promedio de espera de la ruta crítica y la desaceleración promedio de la ruta crítica. Se discutes la robusteza de las estrategias analizadas.
In this thesis, we present an experimental study of deterministic non-preemptive multiple workflow scheduling strategies on a grid. We distinguish twenty five strategies depending on the type and amount of information they require. We analyze scheduling strategies that consist of two and four stages: labeling, adaptive allocation, prioritization, and parallel machine scheduling. We apply these strategies in the context of executing the Cybershake, Epigenomics, Genome, Inspiral, LIGO, Montage, and SIPHT workflows applications. In order to provide performance comparison, a joint analysis considering three metrics is performed. A case study is given and corresponding results indicate that well known DAG scheduling algorithms designed for single DAG and single machine settings are not well suited for grid scheduling scenarios, where user run time estimates are available. We show that the proposed new strategies outperform other strategies in terms of approximation factor, mean critical path waiting time, and mean critical path slowdown. The robustness of these strategies is also discussed.
CICESE
2012
Tesis de doctorado
Español
Hirales Carbajal,A.2012.Calendarización de múltiples flujos de trabajo empleando estimaciones de tiempo de ejecución de usuario.Tesis de Doctorado en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California.vii, 166 pp.
CIENCIA DE LOS ORDENADORES
Aparece en las colecciones: Tesis - Ciencias de la Computación

Cargar archivos:


Fichero Descripción Tamaño Formato  
188961.pdfVersión completa de la tesis10.98 kBAdobe PDFVisualizar/Abrir