SIMTERM calcula o grao de similitude ou sinonimia entre dúas palabras dadas, utilizando como fonte de información o tesauro WordNet. Incorpora dous tipos de modelos de similitude relacional:
- unha aproximación baseada nos conxuntos de sinónimos (synsets) de cada palabra e aplicando medidas de distancia como o coeficiente de Jaccard, Dice, etc.;
- unha aproximación baseada nos hiperónimos e hipónimos de cada termo (construíndo un grafo) e aplicando medidas de distancia en grafos, tales como Path Length, Wu & Palmer,...
Os modelos anteriores dan lugar a un total de 6 medidas diferentes, que atenden a criterios de similitude diversos.
SIMTERM é un proxecto realizado no CiTIUS dentro do programa Talentum, patrocinado por Telefónica.
Autores
-
- Investigadores
- Alberto Bugarín Diz
- Yago Fontenla Seco
- Martín Pereira Fariña
-
- Colaboradores
- Telefónica