En directe: En Joc

 Llagostera Ràdio on-line

El conseller de Polítiques Digitals, Jordi Puigneró, en una roda de premsa de presentació del projecte 'AINA', al Barcelona Supercomputing Center. / Foto: Aina Martí (ACN)

Notícies locals i comarcals
Tipografia
  • Molt Petita Petita Mitjana Gran Enorme
  • Per Defecte Helvetica Segoe Georgia Times

El Govern destinarà 3 milions d'euros a una nova fase del projecte 'AINA', que busca fer possible que les màquines entenguin i parlin en català constituint un corpus massiu de dades, en col·laboració amb el Barcelona Super Computing Center.

Després d'aconseguir desenvolupar un corpus de text de més de 1.770 milions de paraules reunides en 95 milions de frases, ara el projecte buscar crear un diccionari de veu del català.

El Departament de Polítiques Digitals llançarà una campanya aquest dimecres per aconseguir que "milions de veus" parlants de la llengua se sumin, buscant la diversitat de variants, edats, gèneres o orígens per tal d'aconseguir duplicar la base de dades actual de veu en català, que és de 1.000 hores.

El corpus de veu en català es nodrirà dels continguts obtinguts a través de la plataforma de 'Common Voice' de Mozilla, on tothom que ho vulgui podrà llegir i enregistrar un nombre il·limitat de frases per ajudar les màquines a aprendre com parlen les persones.

De moment, el perfil de veu majoritari a la plataforma de Mozilla és la d'homes d'entre 30 i 50 anys parlants de català central. Per això, la campanya 'La nostra llengua és la teva veu' convida la ciutadania de totes les edats, gèneres i procedències a "donar" la seva veu.

També es faran servir els arxius documentals de la Corporació Catalana de Mitjans Audiovisuals o el Consell de l'Audiovisual de Catalunya per ensenyar els aparells tecnològics a parlar i entendre la llengua catalana.

En paral·lel, el projecte es marca també com a objectiu d'aquest any la creació de la segona versió del corpus de text del català, que compta amb 1.770 milions de paraules recollides en 95 milions de frases. A partir d'ara, es treballarà per recollir tots els matisos de la llengua escrita, ja siguin variants dialectals o registres lingüístics, com ara el col·loquial, el literari o l'administratiu.

"Ja tenim l'esquelet. Ara el que hem de construir és la seva musculatura amb la campanya de recollida de veus, de parelles lingüístiques, amb una web que permetrà que qualsevol persona pugui ajudar 'AINA' a aprendre el català", ha dit el vicepresident del Govern i conseller de Polítiques Digitals, Jordi Puigneró, en una roda de premsa per presentar el projecte.

Vota el número 1

Pel 26 d'abril

COL·LABORADORS