ExpliClas: Un Servicio Web que Genera Automáticamente Explicaciones en Lenguaje Natural de Árboles de Decisión para Clasificación

Con la reciente entrada en vigor de la nueva Regulación General de Protección de Datos se abre la puerta al denominado "derecho a la explicación", por el que los ciudadanos pueden demandar a empresas o instituciones explicaciones asociadas a las decisiones tomadas de forma automática por cualquier aplicación o sistema inteligente. Esto es especialmente crítico si consideramos que hoy en día la mayoría de sistemas inteligentes se construyen de forma automática a partir de datos, prestando atención casi exclusiva a su precisión en los resultados, pero sin preocuparse demasiado de su interpretabilidad. En este contexto, cobra fuerza la investigación en nuevos algoritmos de Inteligencia Artificial Explicable. Desde un punto de vista técnico, hay básicamente dos opciones: (1) el sistema inteligente está construido siguiendo un modelo interpretable (también llamado de caja blanca) que un usuario experto (u otro sistema automático) puede analizar y entender a fin de elaborar una explicación; o (2) el sistema está construido siguiendo un modelo directamente explicable que genera las explicaciones por sí mismo. ExpliClas es un servicio Web que genera automáticamente explicaciones en lenguaje natural sobre problemas de predicción aprendidos mediante árboles de decisión para clasificación. Está implementado en código abierto y dispone de una API REST Java. En su versión actual genera explicaciones en inglés (utilizando la librería SimpleNLG) asociadas a árboles de decisión construidos con el software Weka de aprendizaje máquina y conjuntos de datos con atributos numéricos. Genera de forma automática explicaciones en lenguaje natural acerca del funcionamiento global del clasificador y del conjunto de datos que se ha utilizado para aprenderlo y explicaciones particulares que justifican la clasificación de una instancia concreta. Además del ejemplo de la figura 1, donde se explica en lenguaje natural un caso práctico relativo a la clasificación de diferentes estilos de cerveza, están disponibles un buen número de casos reales. La siguiente versión de ExpliClas incluirá otros idiomas (español y gallego) así como nuevos modelos de clasificación y predicción, tanto implementados en Weka como en otras librerías o plataformas. ExpliClas es la base de una tecnología integrable con cualquier sistema de información corporativo que requiera generar explicaciones en lenguaje natural para cualquier dominio, como por ejemplo industria 4.0, e-salud, alimentación o inteligencia y procesos de negocio.

keywords: Inteligencia Artificial Explicable, Generación de Explicaciones en Lenguaje Natural, Problemas de Clasificación y Árboles de decisión