AGI - È il primo passo verso un sistema di traduzione del parlato di una lingua non scritta alimentato dall’Intelligenza Artificiale ed è stato fatto con l’hokkien, una delle lingue ufficiali di Taiwan, parlata dai cinesi emigrati ma priva di una forma scritta standard. Il sistema è stato presentato oggi da Meta.
“Questa tecnologia - fa sapere Palo Alto - permette a chi parla hokkien di tenere conversazioni con persone che parlano inglese. Per sviluppare questo nuovo sistema di traduzione solo vocale, i ricercatori per l‘IA di Meta hanno dovuto superare molte sfide date dai tradizionali sistemi di traduzione automatica, come la raccolta dei dati, la progettazione del modello e la valutazione”.
L’obiettivo dei ricercatori di Meta è rendere “il sistema di traduzione in hokkien parte di un traduttore vocale universale”: un modello open-source in cui “il codice e i dati utilizzati per allenare la comunità dell'IA” consentiranno “ad altri ricercatori di portare avanti questo lavoro”.
Nella sua fase attuale, secondo i ricercatori, questo approccio “consente a una persona che parla hokkien di parlare con una persona anglofona. Sebbene il modello sia ancora in fase di sviluppo e possiamo tradurre solo una frase intera alla volta, si tratta di un passo verso un futuro in cui sarà possibile la traduzione simultanea tra le lingue”.
…anche nel metaverso
Meta è impegnata nello sviluppo di un sistema di Intelligenza Artificiale in grado di fornire una traduzione speech to speech (il parlato) in tempo reale in tutte le lingue: anche quelle principalmente parlate. Il progetto si chiama Universal Speech Translator ed è stato presentato a febbraio da Meta.
“Fino ad ora - ha spiegato la società di Mark Zuckerberg - le traduzioni effettuate dall'Intelligenza Artificiale si sono concentrate principalmente su lingue scritte. Eppure, più del 40% delle oltre 7 mila lingue attualmente in uso sono principalmente orali e non hanno una forma scritta standard o un sistema di scrittura adottato su larga scala”. Tra le obiettivi dell’iniziativa “aiutare a rimuovere le barriere e ad avvicinare le persone ovunque si trovino, anche nel Metaverso”.
La raccolta dei dati
“Raccogliere dati sufficienti è stato un ostacolo importante che ci si è presentato durante la creazione del sistema di traduzione per l'hokkien”, una lingua povera di risorse, non esiste cioè “una gamma di dati disponibili per allenare il sistema”.
Per superare questo ostacolo, i ricercatori spiegano di “aver sfruttato il mandarino come lingua intermedia: abbiamo tradotto un contenuto vocale in inglese (o hokkien) in un testo in mandarino e poi lo abbiamo tradotto in hokkien (o inglese) e aggiunto ai dati per l'allenamento del modello. Questo metodo ha migliorato enormemente le prestazioni del modello sfruttando i dati di lingue simili con più risorse disponibili”.
Data mining
Le tecniche sviluppate per l'hokkien “possono essere estese a molte altre lingue, sia scritte che orali. A questo scopo, stiamo per rilasciare la matrice orale, un vasto corpus di traduzioni speech-to-speech elaborato con l'innovativa tecnica di data mining di Meta, chiamata LASER, che consentirà ai ricercatori di creare i propri sistemi di traduzione speech-to-speech e basarsi sul nostro lavoro per progredire”.