Desarrollo, despliegue y validación de un laboratorio virtual oceanográfico basado en computación Grid

TítuloDesarrollo, despliegue y validación de un laboratorio virtual oceanográfico basado en computación Grid
Autor/aDavid Mera Pérez
DirectoresJosé Manuel Cotos Yáñez
TipoTese doutoral
Data de lectura01/04/2013
Lugar de lecturaUniversidade de Santiago de Compostela
AbstractEl creciente desarrollo de la observación de la Tierra con el lanzamiento cada año de nuevas y más sofisticadas misiones, ha provocado que el análisis de la ingente cantidad de datos generada sea una tarea tediosa y, a menudo, inabarcable. Sería deseable que la comunidad científica tuviera un acceso ágil y eficiente que extrajese el mayor partido a ese conjunto de datos. Diferentes experiencias trataron y tratan de optimizar los recursos compartidos por una comunidad científica utilizando como base la computación Grid. Se propone realizar una tesis centrada en la computación Grid y en sus aplicaciones prácticas. La tesis se dividirá en una etapa de desarrollo de un laboratorio virtual llamado RETELAB y otra de validación del entorno. En la primera etapa, se desarrollará un portal Web que permitirá acceder y gestionar, en base a la computación Grid, recursos distribuidos y heterogéneos de forma transparente al investigador y crear así un entorno colaborativo y distribuido dónde desarrollar proyectos de investigación relacionada con la teledetección oceanográfica. El desarrollo de RETELAB será acometido en cinco fases. Durante la primera fase se desplegará un portal Web, basado en portlets, que permitirá el acceso al sistema Grid. En una segunda fase se desarrollarán diversos procedimientos para gestionar, de forma sencilla y transparente, el acceso y el registro de los usuarios, lo que implicará administrar los certificados de seguridad pertinentes. El control de acceso al sistema Grid estará basado en un sistema de roles soportado por un software como PERMIS. Durante esta fase también se integrará el software de Shibboleth que proporcionará un sistema de autenticación "Single Sign-on". Durante la tercera fase del desarrollo se desplegará un sistema de almacenamiento virtual y distribuido dirigido por metadatos, es decir, cada elemento almacenado estará definido e identificado a través de metainformación que posteriormente facilitará el proceso de búsqueda. Los metadatos que se utilizarán serán los definidos en la ISO 19115. RETELAB contará con, por lo menos, dos herramientas de visualización, el Unidata Integrated Data Viewer y un Live Access Server. En la cuarta fase del desarrollo de RETELAB se creará un portlet para el envío y monitorización de trabajos al Grid. Para ello, se integrará el metaplanificador GridWay que permitirá abstraer a los usuarios de detalles de configuración y gestión de los trabajos. La quinta y última fase de RETELAB será el desarrollo de aplicaciones para su validación, esta fase se solapa con la segunda etapa de la tesis que es la validación del entorno a través del desarrollo de un sistema de detección de vertidos de hidrocarburos en la superficie marina utilizando de imágenes obtenidas por Radares de Apertura Sintética (SAR) a bordo de satélites. El análisis de este tipo de imágenes pasa por detectar regiones más oscuras generadas por la falta de rugosidad en la superficie del mar. Esto es debido a que la presencia de una capa o película de aceite anula las ondas de Bragg presentes en la superficie. El principal problema que presenta este tipo de análisis es la presencia de falsos positivos debido a diferentes fenómenos naturales (principalmente el bajo viento). Por esto, la mayor parte de los sistemas en producción necesitan de un supervisor humano. El objetivo final es desarrollar un sistema que simule el comportamiento de un experto y discrimine los falsos positivos. El algoritmo estará formado principalmente por 3 fases. La primera fase consistirá en un proceso de segmentación basado en una umbralización adaptativa que tenga en cuenta la velocidad del viento. El objetivo de esta umbralización es destacar todos los posibles candidatos a vertido. En la segunda fase se analizarán los candidatos y se óbtendrá un vector de características de cada uno de ellos. Por último, se desarrollarán y analizarán varios clasificadores encargados de separar los falsos positivos de los vertidos utilizando como base los vectores de características.