Recuperación de sentencias relevantes e noveis empregando modelos e técnicas de recuperación de información

Recuperación de sentencias relevantes e noveis empregando modelos e técnicas de recuperación de información

Descrición

A finalidade deste proxecto é mellorar a eficacia dos sistemas de recuperación de sentenzas e non redundancia. É unha tarefa no campo de Recuperación de Información (RI) que supón ir máis alá do labor básico de recuperación de documentos. Unha vez que unha determinada consulta de usuario recupera un conxunto ordenado de documentos, hai que procesar este ranking identificando sentenzas (ou frases) relevantes para a consulta e evitando a súa repetición. Ademais, os resultados de investigación obtidos a nivel internacional ata a data manifestan claramente a necesidade de maiores esforzos de investigación, tanto para detectar as sentenzas relevantes como as noveis.

No contexto deste proxecto de investigación abordaranse aproximacións baseadas en Modelos de Linguaxe (“Language Models”), cuantificación borrosa e redución de dimensionalidade para resolver o problema da recuperación de sentenzas e non redundancia. Cabe esperar que a variedade das aproximacións consideradas permita mellorar a efectividade desta tarefa así como favorecer a fertilización cruzada entre as distintas liñas de investigación abordadas.

Obxectivos

O obxectivo principal do proxecto é profundar na tarefa de recuperación de sentenzas e non redundancia, aumentando o estado do coñecemento que existe actualmente sobre a mesma e identificando vías para a mellora do rendemento, tanto na recuperación de sentenzas relevantes como no posterior filtrado de redundancia. Este obxectivo principal pode ser desglosado en varios subobxectivos:

  • Determinar se os Modelos de Linguaxe Estatísticos (MLs) poden achegar beneficios para recuperar sentenzas relevantes. O éxito da aplicación de Modelos de Linguaxe para outras tarefas de RI é unha baza importante para poder conseguir resultados potencialmente relevantes para o eido da tarefa de novelty.
  • Determinar se os Modelos de Linguaxe poden subministrar beneficios para recuperar sentenzas noveis. A novidade deste subobxectivo está avalada pola escaseza de traballo en MLs para determinar redundancia.
  • Determinar se a cuantificación borrosa pode mellorar a precisión na recuperación de sentenzas relevantes.
  • Determinar se a cuantificación borrosa pode ser útil na detección de sentenzas redundantes. Ambos obxectivos (O3 e O4) son novidosos, pois tampouco se levou a cabo investigación algunha en cuantificación borrosa para o problema de recuperación de sentenzas e non redundancia. Son obxectivos prometedores, pois a cuantificación borrosa revelouse recentemente prometedora como mecanismo de emparellamento para RI.
  • Determinar a eficacia de métodos baseados en LSI para a detección de sentenzas relevantes e non redundantes. O obxectivo é novidoso xa que non se ten aplicado LSI a esta tarefa e relevante polos resultados obtidos por LSI en construción de resumos.

Investigadores