Measuring Comparability of Multilingual Corpora Extracted from Wikipedia

Los corpus comparables son muy útiles en variadas tareas del procesamiento del lenguaje tales como la extracción de léxicos bilingües. on la mejora de la calidad de los corpus comparables, podemos mejorar la calidad de la extracción. Este art ́ıculo describe algunas estrategias para construir corpus comparables a partir de la Wikipedia, y propone una medida de comparabilidad. Fueron realizados algunos experimentos utilizando la Wikipedia portuguesa, española e inglesa

keywords: Extracción de Información, Corpus Comparables, Léxicos Bilingües, Comparabilidad