Aprendendo a redactar aos ‘robots escritores’

O congreso de referencia internacional en Xeración de Linguaxe Natural (NLG) chega por vez primeira a España, baixo a atenta mirada das principais empresas do eido.

Comitivas de xigantes tecnolóxicos como Microsoft, eBay ou IBM e máis de 100 expertos de 20 países e catro continentes distintos (América, África, Asia, e Europa): o crecente interese pola Xeración de Linguaxe Natural -unha técnica de Intelixencia Artificial de máxima actualidade, máis coñecida como ‘NLG’ polas súas siglas en inglés-, reunirá entre o 4 e o 7 de setembro en Santiago de Compostela a industria e investigadores de todo o mundo ao longo do 10º Congreso Internacional INLG (International Natural Language Generation), que se celebrará por vez primeira en España.

Considerado o primeiro congreso mundial na área, a cita adquiriu aínda maior relevancia logo da súa edición máis recente, ao absorber o principal encontro europeo do sector –o simposio ‘ENLG’, que se integrará desde este ano nas sucesivas edicións de ‘INLG’-. Nesta ocasión, a organización do evento corre a conta do CiTIUS, que con esta nova cita promovida polo Grupo de Sistemas Intelixentes pon o broche de ouro a un verán de encontros científicos de primeira magnitude, incluíndo duas escolas de verán en Intelixencia Artificial e o Congreso Internacional Euro-Par 2017 –referente europeo en computación paralela e distribuída-.

Dos informes de actividade aos “robots xornalistas”

Se falar de Intelixencia Artificial remite con frecuencia á imaxe dun ‘robot’ autónomo, as técnicas empregadas no ámbito de NLG confirman a capacidade das máquinas para desenvolver de maneira ‘non supervisada’ distintas tarefas tradicionalmente reservadas a un experto humano. Así, a xeración de textos gramaticalmente correctos a partir de datos numérico-simbólicos (táboas e gráficos non sempre doados de entender) é xa unha realidade, en moitos casos indistinguible para o lector dos textos redactados por un especialista. Eidos de alto impacto social, como a meteoroloxía ou a xeración automática de novas en prensa, contan xa con tecnoloxía en pleno funcionamento.

Un dos principais retos que se presentan na actualidade a nivel científico é a xestión da gran cantidade de datos xerados diariamente; INLG2017 servirá de punto de encontro para presentar os últimos avances nunha área especialmente atractiva para as empresas, por tratarse dun mercado emerxente que move millóns de euros a nivel mundial.

Entre os asistentes destacados ao congreso estará o Profesor Ehud Reiter, catedrático de Linguística Computacional na Universidade de Aberdeen (Escocia) e pioneiro en NLG; Reiter é tamén fundador dunha das principais empresas na área: a compañía ARRIA NLG, un dos patrocinadores da presente edición xunto coa compañía de marketing por email  Phrasee e a consultora multinacional Accenture.

Ademais, o congreso contará tamén coa presenza de dous relatores invitados: Frank Schilder, de Thomson Reuters; e Gemma Boleda (Universidade Pompeu Fabra), unha nova investigadora do programa Ramón y Cajal que atesoura xa un prometedor currículo (máis de 900 citas acumuladas polos seus traballos científicos), e á que o Consello Europeo de Investigación vén de conceder unha das prestixiosas axudas ERC Starting Grant para consolidar o seu traballo.

Entre o resto dos asistentes cabe destacar tamén á investigadora Claire Gardent, presidenta de 'SIGGEN' (o grupo de interés que auspicia o congreso) e membro do CNRS (Centro Nacional en Francia para a Investigación Científica, polas súas siglas en francés) así como ao investigador postdoctoral do CiTIUS Alejandro Ramos, recoñecido polo seu traballo GALiWeather con distintos premios a nivel nacional e internacional, entre os que destaca o Premio de investigación 2017 da Sociedade Científica Informática de España (SCIE) - Fundación BBVA.