Hacia una Siri o Alexa que interectúa en euskera

Foto: Un teléfono con el asistente de voz  Siri
Foto: Un teléfono con el asistente de voz Siri
Euskarabidea anima a través de una campaña a la ciudadanía a grabar su voz para enseñar euskera a las nuevas tecnologías en el portal gaitu.eus
Hacia una Siri o Alexa que interectúa en euskera

El Gobierno de Navarra, el Gobierno vasco y la Oficina Pública de la Lengua Vasca, dentro del convenio de colaboración institucional Hiruko Ituna, han puesto en marcha una campaña denominada Gaitu para enseñar euskera a las máquinas y nuevas tecnologías que requieren una gran masa de datos textuales y orales, en las que las lenguas no mayoritarias también deben asegurarse su presencia digital para poder ser usada en el día a día. Bajo el lema "Batu ditzagun gure ahotsak/Unamos nuestras voces", se pide a los vascoparlantes que entren en el portal gaitu.eus para grabar su voz y así contribuir al desarrollo de la lengua y cultura vascas. 

A más voces y grabaciones, más amplio será el banco de datos el material con el que trabajarán las nuevas tecnologías. Las tecnologías actuales exigen enormes masas de datos textuales y orales por lo que es necesario garantizar la presencia del euskera en ese ámbito digital, han resaltado todos los promotores de la idea.

Esta campaña se ha dado a conocer esta mañana en un acto organizado en el centro Tabakalera de Donostia/San Sebastián. En la misma han participado la vicepresidenta segunda del Gobierno de Navarra y consejera de Memoria y Convivencia, Acción Exterior y Euskera, Ana Ollo; el consejero de Cultura y Política Lingüística del Gobierno Vasco, Bingen Zupiria; y agentes relacionados con el euskera y las nuevas tecnologías y el euskera, entre otros, miembros de la red Librezalea o de la asociación Bagera.

Ana Ollo, vicepresidenta segunda del Gobierno de Navarra, que ha estado acompañada por el director gerente de Euskarabidea, Javier Arakama, ha resaltado la coherencia de este proyecto con las líneas de trabajo de Euskarabidea que tienen como objetivo contribuir a estrechar las relaciones del euskera y las nuevas tecnologías. De hecho, “en la planificación estratégica del departamento se estableció desde el primer momento como prioritario el convertir las tecnologías de la información y la comunicación en un nicho natural de desarrollo propio del euskera, como estrategia para estrechar la conexión del euskera y la modernidad”, ha dicho. Otro ejemplo es el proyecto Sarean Euskaraz, cuya séptima edición se celebrará este año (el 10 y 11 de octubre), los pódcast “Euskara aleka” y “Ecos del euskera” o la colección de vídeos infantiles “Mattin eta Kattalin” así como el trabajo con la enciclopedia virtual Wikipedia. 

 Ollo, volviendo a la iniciativa presentada esta mañana, ha explicado que hoy día, “para que el euskera haga frente los retos de las tecnologías del lenguaje, es fundamental tanto el impulso de las administraciones públicas como la implicación de la población como en este caso”.  “El objetivo es que la comunidad vascohablante haga suyo el proyecto Gaitu. De hecho, es la gente la que lo hará posible. El rol de las administraciones públicas es animar a la ciudadanía a participar y facilitar esa participación”, ha explicado en su intervención. 

El consejero Bingen Zupiria, por su parte, ha señalado que las lenguas minoritarias no están en las aspiraciones de las grandes empresas tecnológicas y que "el euskera tenemos que introducirlo nosotras y nosotros mismos en el mundo digital". Ese es precisamente el objetivo de la campaña Gaitu, conseguir miles de voces, miles de horas de grabación en euskera. Ha citado ejemplos de la vida cotidiana que demuestran que la tecnología tiene una "relación directa" con el lenguaje: mensajes al móvil por dictado; orden por voz para llamar a una persona concreta; instrucciones del navegador del vehículo u órdenes por voz a dispositivos domésticos. "Para que las máquinas entiendan y hablen nuestro idioma, antes tenemos que enseñarles", ha asegurado el consejero Zupiria. 

Cómo colaborar: hacia una Alexa o Siri que interactúen en euskera

El objetivo es crear un banco de voces público en euskera. Uno de los retos actuales del euskera es capacitar a la inteligencia artificial para que los vascohablantes puedan interaccionar con las máquinas en su lengua. Ya hay máquinas con las habitualmente la ciudadanía se relaciona en las lenguas mayoritarias, por citar algunas de las más populares que entienden la voz humana: Alexa, de Amazon, Asisstant, de Google, Siri o Cortana. Y eso es posible porque a las máquinas se les ha enseñado a entender esas lenguas y se las entrena. 

Además, interaccionar con máquinas es cada vez más habitual en los servicios que se reciben telefónicamente como llamadas al ayuntamiento, al centro de salud o dar un parte al seguro. A las máquinas se las ha entrenado para que entiendan esas lenguas mayoritarias, y para ese entrenamiento han sido necesarios grandes bancos de voces, gracias a los cuales las máquinas han aprendido a reconocer la voz humana.  Para que las máquinas aprendan cómo hablan los euskaldunes y sean capaces de entender el euskera, hace falta que aprendan de muchas voces, que oigan muchas grabaciones de gente diferente hablando en euskera. Eso es un banco público de voces que es imprescindible para que las empresas de tecnología que quieran desarrollar aplicaciones en euskera, tal y como hacen en las lenguas mayoritarias, puedan tener acceso a él.  El objetivo es conseguir muchas voces y muy diferentes. Cuantas más y más diferentes sean las voces que se consigan, mayor nivel de comprensión en euskera conseguirán las máquinas.

Para colaborar en este “ciber auzolan” hay que entrar en el portal gaitu.eus, la plataforma ofrecerá frases a usuarias y usuarios para grabar con su voz. La plataforma está dirigida a mayores de edad y cuantas más voces consiga, mejor. 

Esto es posible gracias a la iniciativa internacional "Common Voice", una propuesta abierta, sin ánimo de lucro y colaborativa. Han empezado a hacer aportaciones vocales de “Common Voice” en 105 idiomas y se están preparando casi en otros tantos.