Un gruppo di studenti della University of Southern California, seguiti dal ricercatore Alessandro Vietti, sta applicando innovativi strumenti computazionali allo studio delle lingue minoritarie e in via di estinzione.

Le lingue, quando muoiono, si portano via, assieme all’ultimo parlante, un pezzo di mondo. Dopo, diventa molto difficile ricostruire l’idioma scomparso, se non esiste una documentazione sistematica.

Attualmente, secondo stime dell’Unesco, circa la metà delle 6.000 lingue parlate sulla Terra, sono a rischio scomparsa. La difficoltà maggiore con cui si scontrano i linguisti è la lentezza con cui riescono a raccogliere materiale sufficiente per documentare le lingue minoritarie e in via di estinzione. In sostanza, troppe sono le lingue da preservare e non abbastanza rapidi gli approcci descrittivi tradizionali. Ora, gli enormi progressi nel campo della tecnologia informatica potrebbero però fornire la soluzione a questo problema.

“Gli straordinari successi nel machine learning hanno rivoluzionato il lavoro sul riconoscimento vocale e l'elaborazione del linguaggio naturale e potrebbero perciò essere uno strumento importante nel futuro della documentazione linguistica”, spiega Alessandro Vietti, linguista e ricercatore della Facoltà di Scienze della Formazione e coordinatore del laboratorio di speech sciences ALPS (Alpine Laboratory of Phonetic Sciences) di unibz.

Alessandro Vietti, ricercatore e coordinatore del laboratorio di speech sciences ALPS.

A questo proposito, Vietti ha avviato una collaborazione con il prof. Khalil Iskarous, docente della University of Southern California, per effettuare ricerche che integrino i metodi della ricerca linguistica empirica con quelli della linguistica computazionale. Il programma di ricerca, nello specifico, persegue l’obiettivo di sperimentare gli strumenti del machine learning nell’ambito della documentazione linguistica.

Due studentesse di USC durante il lavoro di raccolta dei dati a Vigo di Fassa.

Proprio nell’ambito di questa cooperazione è nata l’idea di un programma di ricerca e didattica dedicato alla lingua ladina: “Computational Methods for Language Documentation: Ladin”. Dal 28 maggio scorso, e fino a fine giugno, una ventina di studenti dell’ateneo californiano, iscritti a corsi universitari di diverse discipline – dalla linguistica, linguistica computazionale, lingue romanze fino al machine learning, speech recognition e natural language processing – stanno lavorando sul campo, in Val di Fassa, fianco a fianco con il gruppo dei ricercatori del laboratorio ALPS. “Stiamo raccogliendo dati linguistici sul campo, con interviste o interazioni spontanee. Successivamente, li analizziamo in modo automatico utilizzando i modelli di deep neural network”, spiega Vietti. La parte di ricerca empirica può contare sulla collaborazione dell’Istituto Culturale Ladino “Majon di Fascegn” di Vigo di Fassa. 

La scelta del ladino come oggetto di questo nuovo approccio analitico non è casuale. “Il ladino infatti è una lingua ampiamente descritta e studiata, così come sono state già oggetto di numerosi studi sia le varietà linguistiche parlate nel territorio circostante, sia le lingue romanze con cui il ladino è imparentato”, commenta Vietti, “In questo modo sarà più facile valutare i risultati del lavoro svolto sul riconoscimento automatico del parlato, sull’analisi morfologica e sul parsing sintattico, ovvero l’assegnazione di una frase a una struttura sintattica, sulla base di ciò che già si conosce”.

Se questo progetto avrà successo, consentirà non solo di produrre un database di materiali ladini, che potrebbe essere utilizzato da parlanti nativi, linguisti e antropologi, “ma anche di individuare i punti di forza e i limiti degli attuali approcci automatici”, conclude il ricercatore.

 

Related Articles

Article
Comunicare il rischio del cancro. La Commissione europea sceglie progetto unibz

I diagrammi partecipati di KnowAndBe.live scelti come strumento di sensibilizzazione dal Joint Research Centre della Commissione Europea.

Article
Spesso discriminati anche se qualificati

Uno studio di Eurac Research guarda alle esperienze dei ragazzi di seconda generazione in cerca di lavoro e propone alcune misure a favore delle pari opportunità.

Schönheits-App für Äpfel

Die Schönheit von Äpfeln ist ein wichtiger ökonomischer Faktor. Ein interdisziplinäres Forschungsprojekt von Informatikern, Naturwissenschaftlern und Experten des Versuchszentrums Laimburg sucht Wege, sie auch während der Lagerung besser zu bewahren.

Reportage
Con il trapano in cerca di storia

Come si differenziavano dal punto di vista genetico gli abitanti della val Pusteria, della val Isarco e della val Venosta nell’Alto Medioevo? Gli studiosi di Eurac Research cercano risposte nel DNA estratto da decine di scheletri. Il lavoro richiede forza e pazienza. Una visita a Valentina Coia, in laboratorio.