Deseño automático dunha ontoloxía de nomes propios para un sistema de pregunta-resposta

Deseño automático dunha ontoloxía de nomes propios para un sistema de pregunta-resposta

Descrición

Este proxecto consiste na construción dunha ontoloxía dos nomes propios contidos no texto da noticia sen restricións, co fin de mellorar o rendemento nunha tarefa de procura de respostas para os xornais portugueses e españois. O corpus de proba consiste en dous anos de noticias de, por un lado, La Voz de Galicia y El País (diarios españois), e polo outro O Público (cabeceira portuguesa). A ontoloxía de entidades nomeadas está constituida polos nomes propios que se refiren a lugares, persoas públicas e organizacións.

Obxectivos

  • A construción de corpus de textos españois e portugueses a partir de noticias.
  • PoS tagging e análise sintáctica.
  • Recoñecemento de entidades con nome e clasificación.
  • A agrupación de entidades con nome.
  • Deseño dunha ontoloxía OWL de entidades con nome.

Investigadores

Detalles

Data de execución:01/01/2008 - 31/03/2010
Financiado porAcciones Integradas España-Portugal, Ministerio de Educación y Ciencia, HP2007-0061