SIMTERM calcula el grado de similitud o sinonimia entre dos palabras dadas, utilizando como fuente de información el tesauro WordNet. Incorpora dos tipos de modelos de similitud relacional:
- una aproximación basada en los conjuntos de sinónimos (synsets) de cada palabra, aplicando medidas de distancia como los coeficientes de Jaccard, Dice, ...
- una aproximación basada en los hiperónimos e hipónimos de cada término (construyendo un grafo) y aplicando medidas de distancia en grafos, tales como Path Length, Wu & Palmer,...
Los modelos anteriores dan lugar a un total de seis medidas diferentes, que atienden a criterios de similitud diversos.
SIMTERM es un proyecto realizado en el CiTIUS en el marco del programa Talentum, patrocinado por Telefónica.
Autores
-
- Investigadores
- Alberto Bugarín Diz
- Yago Fontenla Seco
- Martín Pereira Fariña
-
- Colaboradores
- Telefónica