Un assistent de veu en un vehicle que t'entén en català, un primer pas en el projecte Aina (ACN/Pau Cortina)

De la Norma a l'Aina: l'objectiu que màquines i apps parlin i entenguin el català

La Generalitat posa en marxa una iniciativa perquè el català no desaparegui de l'espai digital, com les aplicacions o els assistents de veu
Redacció Actualitzat
TEMA:
Català

Cada vegada interactuem més amb les màquines i aplicacions, i la Generalitat s'ha proposat que ho puguem fer també en català. Amb aquest objectiu ha posat en marxa el Projecte Aina, batejat amb aquest nom en honor a Aina Moll, primera directora general de Política Lingüística de la Generalitat i impulsora de La Norma, la primera campanya per a la normalització de la llengua, el 1982.

L'Aina generarà els recursos per crear assistents de veu, traductors automàtics i aplicacions d'intel·ligència artificial en català.

Es tracta que la llengua no desaparegui de l'espai digital que cada cop és més potent. "Ve a fer el català llengua vehicular també en l'àmbit digital", ha destacat el conseller de Polítiques Digitals, Jordi Puigneró.

El conseller Puigneró, en la presentació de l'Aina (ACN/Pau Cortina)

 

El primer pas ja assolit és el corpus del català, una mena de diccionari d'intel·ligència artificial, el més gran creat fins ara, amb 1.770 milions de conceptes, metadades associades a paraules, reunides en 95 milions de frases.

L'ha desenvolupat el superordinador MareNostrum a partir de la descàrrega de textos de diferents fonts digitals.

Entre aquestes, les pàgines web de la Generalitat i el DOGC, que suposen el 33% de tots els continguts, però també "fons com la Viquipèdia o l'Agència Catalana de Notícies", explica la responsable del projecte i colíder de la unitat de Mineria de Dades del Barcelona Supercomputing Center (BSC), Marta Villegas.
 

Han calgut 2.000 hores de processadors del superordinador per revisar les dades i eliminar tot el que fos duplicat o no fos català.

Ara s'hi volen incorporar variants dialectals, diferents registres lingüístics i arxius de veu i imatge, un punt en què comptarà amb els documents de la Corporació Catalana de Mitjans Audiovisuals (CCMA). Per això, la Generalitat destinarà 250.000 euros al BSC, per ampliar el corpus.

Els models que crearà el BSC estaran a disposició de les empreses o les entitats que les vulguin fer servir, ja que es publicaran en obert i amb llicències permissives.

El Projecte Aina per a la normalització del català en l'àmbit digital té un pressupost de 13,5 milions d'euros per al 2020-2024 i confia comptar amb el finançament dels fons europeus NextGeneration.

ARXIVAT A:
Català Internet
VÍDEOS RELACIONATS
El més llegit
AVUI ÉS NOTÍCIA
Anar al contingut