Tecnoloxías da Linguaxe Natural

O Procesamento de Linguaxe Natural (NLP en inglés) refírese á interacción entre computadores e humanos utilizando a linguaxe natural como medio de comunicación. É un ámbito interdisciplinario entre a Intelixencia Artificial e a Lingüística Computacional que trata coa interpretación e comprensión automáticas da linguaxe humana, frecuentemente representada en formatos non estruturados, coma textos ou documentos. Pero tamén trata coa xeración automática de textos en linguaxe natural, a partir de fontes diversas coma datos numéricos ou simbólicos, así coma textos ou documentos.

Obxectivos científicos

No Programa Científico Tecnoloxías da Linguaxe Natural (TLN) investigamos en modelos e desenvolvemos tecnoloxías para diversas tarefas estado da arte en NLP, como son:

  • NLP para extracción de información, análise da linguaxe, extracción de relacións, similitude de sentenzas…
  • Recuperación de Información e tecnoloxías de busca
  • Representación semántica con ontoloxías
  • Sistemas de Big Data a textos: xeración de linguaxe natural dende datos
  • Análise intelixente de datos en NLP: aprendizaxe máquina, minaría de datos, coñecemento e razoamento imprecisos
  • Computación de altas prestacións e tecnoloxías Big Data para NLP

Obxectivos tecnolóxicos

Aplicamos NLP con éxito en diversos ámbitos, coma:

  • Clasificación ou resumo automático de documentos
  • Análise de sentimentos, extracción multilingüe de terminoloxía
  • Perfilado de usuarios e detección temperá de riscos
  • Sistemas “Data to text”

Podes ver algúns dos nosos proxectos de I+D, innovación e transferencia de tecnoloxía en áreas coma a tradución automática, minaría de opinións, sistemas de información ambiental, intelixencia de negocio ou e-saúde, entre outros.

Queres saber máis?

Para colaboracións, visitas, etc. contacta con:

Alberto Bugarín Diz
alberto.bugarin.diz [at] usc.es