Un sistema para la descripción automática en lenguaje natural de gráficas de sectores: aplicación en datos de calidad del aire

En este trabajo presentamos un modelo basado en la generación de lenguaje natural y en la lógica borrosa para la generación automática de descripciones lingüísticas a partir de datos numéricos y su aplicación real en el ámbito de la información ambiental. Basado en dicho modelo, describimos el sistema ICA2Text, que genera automáticamente descripciones en lenguaje natural sobre el índice de calidad del aire (ICA), que es un indicador estándar utilizado por todas las agencias meteorológicas a nivel mundial. ICA2Text es una aplicación real que opera sobre los datos del ICA proporcionados por la Red de Calidad del Aire de la Agencia de Meteorología de Galicia (MeteoGalicia). Siguiendo la metodología estándar de evaluación en el campo de la generación de lenguaje natural, presentamos los resultados de evaluación manual del sistema por parte de tres expertos meteorólogos. Los resultados de dicha evaluación fueron muy satisfactorios, confirmando empíricamente que las descripciones en lenguaje natural que se generan a partir de los datos resultaron muy adecuadas, tanto en su contenido como en su calidad lingüística. Por ello, el sistema estará operativo en breve como servicio público para los usuarios de la web de MeteoGalicia.

keywords: descripciones lingüísticas de datos, sistemas data-to-text, generación de lenguaje natural (NLG)