NOTICIAS: Mellora na recuperación de noticias e no acceso a información financieira: recuperación de textos sobre bases documentais de axencias de noticias

NOTICIAS: Mellora na recuperación de noticias e no acceso a información financieira: recuperación de textos sobre bases documentais de axencias de noticias

Descrición

Este proxecto de investigación está enfocado a proporcionar servizos avanzados de acceso a información sobre documentos textuais que figuran en bases documentais de axencias de noticias. Un mesmo evento ou noticia adoita ser cuberta por moi distintas fontes. A presenza de múltiples documentos informando sobre a mesma temática provoca que os mecanismos e sistemas habituais de procura proporcionen moita información redundante. Isto é debido a que os modelos "estado da arte" de recuperación de información tenden a primar a relevancia dos textos para a consulta do usuario, deixando de lado aspectos importantes como a diversidade.

Ademais da redundancia existente entre noticias de distintas ou da mesma fonte existe o problema da localización da información relevante dentro dun documento. Os usuarios teñen que revisar de modo exhaustivo os contidos dos textos para satisfacer a súa necesidade de información. Isto pode ser aceptable cando o obxectivo da procura sexa a lectura da totalidade da noticia. Non obstante, en moitos casos a información requirida polo usuario é un pequeno extracto e o proceso que tivo que levar a cabo para localizalo innecesariamente tedioso.

Obxectivos

  • Profundar na investigación de modelos e técnicas de recuperación de información aplicados a noticias textuais, dando lugar a un sistema avanzado de acceso á información que traballe sobre bases documentais de noticias.
  • Deseñar sistemas de procura avanzados, capaces de recuperar pasaxes dentro das noticias, detectar a novidade con respecto a outros textos, construír resumos e identificar temas secundarios.

Investigadores

Detalles

Data de execución:01/01/2008 - 15/11/2010
Consorcio
  • Compiladores y Lenguajes (COLE), Universidade de Vigo (líder)
  • Information Retrieval Lab (IRLab), Universidade da Coruña
  • CiTIUS
Financiado porProgramas Sectoriais de Investigación Aplicada. INCITE, Xunta de Galicia, Consellería de Innovación e Industria, 07SIN005206PR
Programas Sectoriais de Investigación Aplicada. INCITE  Xunta de Galicia, Consellería de Innovación e Industria Fondo Europeo de Desarrollo Regional (FEDER)