
Descrición
Neste proxecto deseñamos metodoloxías de interpretación e análise sistemática do coñecemento semántico codificado nos modelos vectoriais en varias linguas. Nomeadamente‚ centrámonos na avaliación da representación do significado (i) das palabras homónimas‚ (ii) de palabras polisémicas‚ (iii) de palabras sinónimas‚ e (iv) de expresións multipalabra (MWEs) con diferentes graos de composicionalidade semántica (i.e.‚ expresións máis ou menos idiomáticas).
Obxectivos
O obxectivo do proxecto é explorar o coñecemento semántico que codifican os modelos vectoriais máis recentes‚ e avaliar novos métodos para mellorar aqueles aspectos nos que estes sistemas non obteñan resultados satisfactorios. Pretendemos tamén proporcionar novos resultados sobre a interpretación por parte de avaliadores humanos dos catro fenómenos semánticos referidos en varios contextos controlados. Entre as alternativas para mellorar a modelaxe exploraremos‚ entre outras‚ estratexias de aprendizaxe composicional‚ o uso de fine-tuning‚ ou a inxección de vectores individuais para as MWEs. Os experimentos e análises serán realizados en galego e portugués‚ castelán e inglés.
Investigadores
-
- Investigador principal
- Marcos Garcia González
-
- Investigadores do CiTIUS
- Pablo Gamallo Otero
Detalles

ED431F 2021/01