Perquè els assistents virtuals ens puguin entendre en català han d'aprendre la llengua i els seus matisos

El projecte AINA perquè les màquines parlin català rebrà tres milions del govern espanyol

La inversió forma part del pla estratègic de la Nova Economia de la Llengua i també preveu invertir 4,5 milions més en projectes lingüístics al País Valencià, el País Basc i Galícia

RedaccióActualitzat

El projecte AINA, que té l'objectiu de crear els recursos tecnològics per facilitar la introducció del català en aplicacions d'intel·ligència artificial, rebrà una subvenció de 3 milions d'euros del govern espanyol. Ho ha provat aquest dimarts el Consell de Ministres.

La inversió forma part del projecte estratègic de la Nova Economia de la Llengua i busca aconseguir que, per exemple, els xatbots de bancs o botigues en línia ens entenguin i responguin en català.

Una altra de les possibles aplicacions seria que es pugui sol·licitar una cita prèvia al nostre CAP mantenint una conversa per internet en llengua catalana.

L'objectiu final del govern espanyol, assegura, és que l'ús de les llengües cooficials en aplicacions tecnològiques sigui rendible i atractiva per a l'administració i les empreses del sector. Per això, també inclou inversions per impulsar sistemes d'intel·ligència artificial en euskera i gallec.

Així, també s'ha aprovat una subvenció de mig milió d'euros per a la Universitat d'Alacant, dos milions al projecte GAITU de la Universitat del País Basc --que també treballa per introduir l'euskera en l'àmbit tecnològic-- i dos milions més per a projectes d'intel·ligència artificial en gallec de la Universitat de Santiago de Compostel·la.

En total, 7,5 milions d'euros que, segons La Moncloa, generaran nous llocs de treball qualificats i impulsaran l'estat espanyol com a país referent en la nova economia de la llengua. 

Elaborar els models lingüístics i les eines perquè les màquines entenguin el català és l'objectiu principal del projecte AINA, que està liderat pel Departament de Polítiques Digitals de la Generalitat i té la col·laboració tècnica i logística del Barcelona Supercomputing Center

Recollides més d'un milió de frases en català

El projecte AINA ja té més d'un milió de veus enregistrades i milers d'hores de gravació

Per construir el corpus de veus --la base de dades-- que necessita una màquina per entendre el que li diuen i pugui respondre, es requereix disposar de milions de de dades de veu que incloguin la riquesa i els matisos de la llengua oral amb tots els seus registres i variants dialectals.

Per això, el mes de febrer passat el Govern va llançar la campanya "La nostra llengua és la teva veu" per recollir el màxim de parlars possibles i nodrir de contingut la primera versió del corpus de veu per ensenyar les màquines a entendre i parlar el català.

El projecte convida la ciutadania de parla catalana de totes les edats, gèneres, condicions i procedències a enregistrar la seva veu a través de la pàgina web del projecte AINA, des d'on tothom pot llegir, enregistrar i validar un nombre il·limitat de frases agrupades de cinc en cinc a Common Voice.

Actualment hi ha més de 25.000 hores enregistrades, tot i que no totes estan validades.

La validació per part de la ciutadania de frases llegides i enregistrades per altres donants és tant important com l'enregistrament de veus, ja que han de passar un procés de certificació abans de poder ser utilitzades per al projecte, segons explica el Departament de la Vicepresidència i de Polítiques Digitals i Territori.

 

ARXIVAT A:
Català Tecnologia
Anar al contingut