
La vera innovazione di “FAMA: The First Large-Scale Open-Science Speech Foundation Model for English and Italian ” non sta solo nella qualità del modello, ma nella sua totale apertura: il modello è infatti stato addestrato su oltre 150.000 ore di dati audio, tutti liberamente accessibili e con licenze permissive. Ai dati audio già disponibili pubblicamente è stata aggiunta una grande quantità di cosiddetti “dati sintetici”, ovvero trascrizioni e traduzioni automatiche in italiano e inglese, realizzati appositamente per il progetto e resi disponibili tramite il dataset MOSEL .
"Il codice, i dati e le procedure utilizzate sono completamente pubblici e documentati, consentendo a chiunque di replicare o adattare il sistema. Il know-how che ha generato questo progetto congiunto e le possibili applicazioni e sviluppo di FAMA lo rendono un asset importante per FBK" spiegano Alessio Brutti, responsabile dell’unità SpeechTek, e Luisa Bentivogli, responsabile dell’unità Machine Translation.
“Abbiamo dimostrato che anche in Italia abbiamo le competenze per creare modelli su larga scala” - aggiungono i coordinatori del progetto Sara Papi e Marco Gaido - “che sono capaci di competere a livello internazionale in completa conformità alle recenti normative europee”.
Attualmente il modello supporta l’italiano e l’inglese ma, grazie all’esperienza maturata su dati, calcolo e gestione delle risorse, costituisce una base solida per costruire in futuro una piattaforma vocale multilingue, interamente open source.
Per addestrare il modello sono state utilizzate le risorse computazionali messe a disposizione da CINECA, che ha fornito la potenza di calcolo e il supporto necessari per gestire i processi su larga scala.
Oltre agli aspetti tecnologici, il progetto rappresenta un passo importante verso un’intelligenza artificiale più aperta, indipendente e riproducibile, ponendo le basi per un ecosistema digitale più equo e accessibile.
Il modello è disponibile su HuggingFace nelle versioni small e medium.
In foto:
Dietro da sinistra: Mauro Cettolo | Matteo Negri | Alessio Brutti | Mohamed Nabih
Davanti da sinistra: Sara Papi | Marco Gaido | Marco Matassoni | Luisa Bentivogli