Enxeñaría de datos

O auxe experimentado polas tecnoloxías da información nas últimas décadas propiciou que os investigadores nos enfrontemos ao manexo eficiente de grandes volumes de datos de natureza complexa, que inclúen datos temporais, espaciais, multimedia, texto, XML, grafos e datos biolóxicos, entre outros. Pensemos por exemplo na monitorización ambiental a partires de sensores locais (redes e estacións de medida) ou remotos (imaxes obtidas dende satélites de observación), na análise textual de información distribuída a través da rede, ou na extracción de información non evidente en grandes conxuntos de datos expresados en linguaxe natural (redes sociais, por exemplo).

As características intrínsecas destes tipos de datos (xeoposicionamento, variabilidade espacial e temporal, ambigüidade ou correlación, entre outros) requiren de modelos, linguaxes, estruturas de almacenamento e indexación e algoritmos de procesamento, que deben ter en conta as características arquitectónicas de novos contornos de computación distribuídos como son a web, as infraestruturas de computación de altas prestacións, a computación na nube, as redes de sensores e a computación ubícua.

Obxectivos científicos

  • Estruturas de indexación e algoritmos de procesamento de consultas para datos multidimensionais, en particular datos nos que as compoñentes espacial e temporal posúen unha relevancia intrínseca.
  • Procesamento de consultas en contornos de computación non convencionais, como por exemplo en arquitecturas baseadas en servizos, computación na nube ou redes de sensores.
  • Modelos, linguaxes e algoritmos para a descrición e explotación de datos de natureza complexa: minería de datos espazo-temporais, minería de grafos, entre outros.
  • Modelos, linguaxes e algoritmos para recuperación de información: representación e procura de texto, así como procesamento de linguaxe natural.

Obxectivos tecnolóxicos

  • Desenvolvemento de ferramentas para o acceso eficiente a datos de natureza complexa como por exemplo datos espacio-temporais ou multimedia.
  • Desenvolvemento de ferramentas para o procesamento eficiente de datos xeográficos, incluíndo tanto datos vectoriais como raster.
  • Desenvolvemento de ferramentas e servizos para a implementación de SIG en web e infraestruturas de datos espaciais en dominios específicos, como a arqueoloxía ou o patrimonio.
  • Desenvolvemento de ferramentas para a recuperación de información xeográfica.
  • Desenvolvemento de ferramentas para a minería de datos temporais: extracción de información temporal cuantitativa entre eventos e episodios en bases de datos temporais.
  • Ferramentas para a descrición lingüística de procesos complexos, en particular series de datos temporais.