ADEGA: Todos os teus documentos enriquecidos con anotación baseada en grafos

ADEGA: Todos os teus documentos enriquecidos con anotación baseada en grafos

ADEGA presenta unha novidosa aproximación para a anotación semántica na que asocia cada termo relevante dun documento cun (sub)grafo extraído da DBpedia, onde o grafo soamente contén información relevante para o contexto definido polo documento anotado. Esta característica contrasta cos procesos de anotación tradicionais, reducindo o ruído introducido polo proceso de anotación e mellorando desta forma a caracterización tanto dos termos como dos documentos anotados.

ADEGA é especialmente útil no dominio de e-learning, para mellorar automáticamente os contidos educativos con información da Wikipedia. Pero ADEGA pode ser utilizado para anotar documentos utilizando outros repositorios e ontoloxías, como no dominio médico, información corporativa, etc.

Vantaxes

  • Gran rendemento.
  • Detección de conceptos que non estean incluídos no documento orixinal a través da navegación en categorías.
  • Soamente se utiliza a información relevante para a anotación de termos. Por exemplo, se o documento e acerca do Antigo Exipto, ADEGA filtra a información do Exipto contemporáneo.
  • Mellora da recuperación de información con información semántica.

Aplicacións

  • E-learning
  • Anotación de información médica
  • Anotación de información corporativa

Descrición

ADEGA: Todos os teus documentos enriquecidos con anotación baseada en grafos

A maioría das aproximacións á anotación semántica da literatura anotan termos a partir dunha única instancia extraída dunha ontoloxía. Sen embargo, coa aparición dos datos vinculados (linked data, en inglés) as técnicas tradicionais de anotación necesitan adaptarse para facer uso destas mega ontoloxías, en moitas ocasións, de dominio xeneral (coma por exemplo a DBpedia). Así, a principal limitación das aproximacións actuais é que a instancia coa que se anota un termo dun documento non contén coñecemento sobre o contexto no que aparece dito termo dentro dese documento, perdendo con elo información que pode ser relevante para describir o termo.

ADEGA presenta unha aproximación novidosa para a anotación semántica a través de (sub)grafos da DBpedia. A aproximación identifica primeiro a información relevante dun documento, coñecida como contexto do documento, e explora entonces o repositorio da DBpedia por medio dun algoritmo sensible ao contexto. Desta forma, ningunha relación relevante da DBpedia é descartada, e a selección de instancias incluídas no grafo baséase na frecuencia dos seus termos do contexto que aparecen nestas relacións.

Información