Un assistent de veu al costat d'un televisor
Els assistents de veu també han d'aprendre el català col·loquial

Els assistents de veu aprenen català i els en pots ensenyar, fins i tot cobrant

Alexa, Siri, Google Assistant i Common Voice demanen gent que els parli en català per entrenar-los amb sistemes d'intel·ligència artificial

Xavier DuranActualitzat

Alexa, l'assistent de veu d'Amazon, parla 7 idiomes i ara està aprenent català. I tothom pot ajudar a ensenyar-n'hi, perquè necessita veus amb molts accents diferents i de gent d'edats i sexes diferents.

Donar ordres oralment a l'ordinador o a qualsevol dispositiu és cada cop més habitual. I es preveu que acabi sent el sistema preferent. Un dels exemples són els assistents de veu, que tant responen a les nostres preguntes buscant informació com posen en marxa o desconnecten electrodomèstics o llums.

Però aquests assistents han de comprendre perfectament allò que se'ls diu i per això viuen un procés d'aprenentatge amb sistemes d'intel·ligència artificial. I això requereix temps. Entre els assistents més coneguts, el menys poliglot és el Bixby de Samsung. Va començar parlant només anglès americà, coreà i xinès mandarí. Ara ja ha après anglès britànic, espanyol d'Espanya, alemany i italià.

Alexa té unes prestacions semblants. Parla també set idiomes: anglès, francès, alemany, italià, japonès, portuguès del Brasil i espanyol. Però dintre d'aquestes llengües també és capaç de comprendre i expressar-se en diversos dialectes. Pel que fa a l'anglès, inclou les variants que es parlen a Austràlia, el Canadà, l'Índia, el Regne Unit i els Estats Units. També domina tant el francès de França com el del Quebec, al Canadà. I és capaç d'expressar-se en l'espanyol que es parla a Espanya, a Mèxic i als Estats Units.
 

En aquests moments es pot accedir als continguts de TV3 i Catalunya Ràdio a través d'Alexa, l'assistent integrat als altaveus intel·ligents Amazon Echo, Echo Dot i Echo Spot, entre altres. En aquest cas, es fa servir una petita trampa: Alexa reconeix "inicia", en català, perquè en la varietat d'espanyol de Mèxic també es pronuncia així.


Els assistents més poliglots

L'assistent Google Home el supera de molt en capacitat lingüística. Parla 13 idiomes: danès, holandès, anglès, francès, alemany, indi, italià, japonès, coreà, noruec, portuguès del Brasil, suec i espanyol. Dintre de l'anglès inclou sis varietats: les d'Austràlia, el Canadà, l'Índia, Singapur, el Regne Unit i els Estats Units. També inclou la possibilitat de parlar en tres dialectes de l'espanyol (Espanya, Mèxic i Estats Units), dos del francès (França i Canadà) i dos més de l'alemany (Àustria i Alemanya).

Però el primer lloc quant a poliglotisme se l'emporta el Siri d'Apple, amb 21 idiomes: àrab, xinès cantonès, xinès mandarí, danès, holandès, anglès, finès, francès, alemany, hebreu, italià, japonès, coreà, malai, noruec, portuguès, rus, espanyol, suec, tailandès i turc. Inclou també varietats dialectals per al xinès, l'holandès, l'anglès, el francès, l'alemany, l'italià i l'espanyol.

Molts d'aquests idiomes, per no dir tots, tenen força variants dialectals que no s'esmenten. Així, l'anglès que es parla al sud d'Anglaterra és molt diferent del que es parla a Escòcia. I el castellà d'Àndalusia i el de Lleó també són diferents. Per això, un assistent de veu no pot aprendre una varietat estàndard i prou, perquè ha d'atendre preguntes i ordres de persones molt diferents. Ja no són només diferències dialectals, sinó també segons el sexe, l'edat i fins i tot característiques de cada persona.
 

Tothom pot ser professor de català

El català hi comença a ser present; encara no en aquests productes, però sí en els projectes per introduir noves llengües. Més enllà dels assistents, és un dels idiomes inclosos en el projecte Common Voice de Mozilla. L'objectiu és crear una base de dades de veus en diferents idiomes, perquè es pugui utilitzar lliurement en programaris de reconeixement de la parla.

Els voluntaris enregistren frases de mostra amb un micròfon i revisen els enregistraments d'altres usuaris. S'hi pot participar per ensenyar català entrant a la web. En una altra pàgina de la web es pot veure en quins idiomes s'està treballant, que són 40, i quantes aportacions han rebut. En aquests moments, el català és el sisè, darrere, per aquest ordre, d'anglès, castellà, alemany, francès i italià, i davant del persa. Perquè l'idioma pugui sortir a producció calen entre 1.000 i 1.200 hores d'entrenament.

A la llista destaca el fet que, juntament amb idiomes amb molts milions de parlants, n'hi ha d'altres de minoritaris. Hi trobem també l'esperanto, la interlingua -la segona llengua auxiliar planificada més parlada del món- i el vòtic -una llengua uraliana en vies d'extinció emparentada amb l'estonià. D'aquesta última només n'hi ha, de moment, dues aportacions.

També hi ha 73 llengües més en desenvolupament, perquè encara no s'han trobat prou participants. D'aquestes, 11 encara no s'han estrenat.


Cobrar per ensenyar a Google Assistant

Per ensenyar català a Alexa cal anar a una pàgina web d'Amazon i seguir les instruccions. La contribució es pot fer des del mòbil (Android i iOS), l'ordinador o l'altaveu intel·ligent Echo. L'usuari entrenarà Alexa donant ordres o fent consultes en català.

Finalment, ensenyant català al Google Assistant fins i tot es guanyen diners, encara que siguin uns modestos 10 dòlars -25 si és un menor i té consentiment dels pares. Després d'indicar edat i sexe cal llegir un text. Els 10 dòlars, abonats per Paypal, es guanyen després de llegir 200 fragments de text.

L'anàlisi de les lectures la farà Lionbridge, una empresa de Massachusetts que, entre altres serveis., ofereix traducció i desenvolupament i proves de programari. Cal inscriure's en una pàgina web on hi ha les instruccions.
 

El 88,9 % dels consumidors vol català en els dispositius

No hi ha terminis per la incorporació del català a aquests sistemes. Però el govern de la Generalitat ja ha adoptat mesures perquè la llengua estigui present en els productes i serveis adquirits per contractació pública i perquè tots els usuaris tinguin cada vegada més interfícies i dispositius en català.

Segons un estudi encarregat per la Direcció General de Política Lingüística, el 88,9 % dels consumidors catalans volen que els assistents de veu del tipus Alexa, Google Assistant, Siri, Bixby i d'altres incloguin el català en la seva oferta de llengües. Segons aquesta direcció general, això suposa 5,5 milions de consumidors potencials. Però caldria incloure-hi els catalanoparlants d'altres territoris i els que viuen a l'estranger.

Això suposa un mercat prou ampli perquè aquestes empreses intentin afanyar-se a incorporar el català. De moment, han posat en marxa aquesta projectes d'aprenentatge, que necessiten l'aportació de milers d'usuaris per tirar endavant.

ARXIVAT A:
Català Tecnologia
ÀUDIOS RELACIONATS
Anar al contingut