Exploración do coñecemento semántico en modelos vectoriais: homonimia‚ polisemia‚ sinonimia e idiomaticidade

Exploración do coñecemento semántico en modelos vectoriais: homonimia‚ polisemia‚ sinonimia e idiomaticidade

Descrición

Neste proxecto deseñamos metodoloxías de interpretación e análise sistemática do coñecemento semántico codificado nos modelos vectoriais en varias linguas. Nomeadamente‚ centrámonos na avaliación da representación do significado (i) das palabras homónimas‚ (ii) de palabras polisémicas‚ (iii) de palabras sinónimas‚ e (iv) de expresións multipalabra (MWEs) con diferentes graos de composicionalidade semántica (i.e.‚ expresións máis ou menos idiomáticas).

Obxectivos

O obxectivo do proxecto é explorar o coñecemento semántico que codifican os modelos vectoriais máis recentes‚ e avaliar novos métodos para mellorar aqueles aspectos nos que estes sistemas non obteñan resultados satisfactorios. Pretendemos tamén proporcionar novos resultados sobre a interpretación por parte de avaliadores humanos dos catro fenómenos semánticos referidos en varios contextos controlados. Entre as alternativas para mellorar a modelaxe exploraremos‚ entre outras‚ estratexias de aprendizaxe composicional‚ o uso de fine-tuning‚ ou a inxección de vectores individuais para as MWEs. Os experimentos e análises serán realizados en galego e portugués‚ castelán e inglés.

Investigadores

Detalles

Data de execución:01/01/2021 - 30/11/2025
Funded by Proxectos de excelencia no ámbito do Sistema universitario de Galicia, Xunta de Galicia‚ Consellería de Educación e Ordenación Universitaria - Subdirección Xeral de Promoción Científica e Tecnolóxica Universitaria‚ Secretaria Xeral de Universidades
Xunta de Galicia‚ Consellería de Educación e Ordenación Universitaria - Subdirección Xeral de Promoción Científica e Tecnolóxica Universitaria‚ Secretaria Xeral de Universidades
ED431F 2021/01