
04 Dicembre 2023
Durante la scorsa giornata Meta ha ufficializzato il primo sistema di traduzione basato sull'intelligenza artificiale per una lingua non scritta, cominciando dal dialetto hokkien taiwanese. Rappresenta di fatto la prima tappa di un progetto più ampio denominato Universal Speech Translator (UST) di Meta AI, che si concentra sullo sviluppo di sistemi di intelligenza artificiale in grado di fornire una traduzione speech to speech in tempo reale in tutte le lingue, anche quelle principalmente parlate.
I primi dettagli erano emersi durante l'evento AI Inside the Lab di febbraio, ma ora sta per arrivare una prima demo funzionante di hokkien, che potrà essere utilizzata da altri ricercatori per sviluppare un sistema di traduzione proprio e basato su questa tecnologia.
Meta afferma che oltre il 40% delle oltre 7.000 lingue esistenti sono principalmente orali e non hanno una forma scritta standard. Il progetto Universal Speech Translator (UST) è basato sull'intelligenza artificiale e si pone il laborioso obiettivo di fornire una traduzione speech to speech in tempo reale in tutte le lingue. A questo proposito Meta afferma.
Crediamo che la comunicazione orale possa aiutare a rimuovere le barriere e ad avvicinare le persone ovunque si trovino, anche nel metaverso. Abbiamo fatto un ulteriore passo in avanti verso questo obiettivo con UST, il primo sistema di traduzione speech to speech per una lingua non scritta alimentato dall’intelligenza artificiale (AI). Come abbiamo annunciato questo mese all’evento di Meta, Connect, i nostri ricercatori per l’intelligenza artificiale hanno costruito e reso open-source sistemi di traduzione per l'hokkien, una delle lingue ufficiali di Taiwan, ampiamente parlata dai cinesi emigrati ma priva di una forma scritta standard.
Il lavoro sarà lungo e complesso e Meta lo sa molto bene, tuttavia il primo passo è stato fatto e molto presto il numero di lingue supportate potrebbe crescere, naturalmente a partire dalle conversazioni in inglese. Per sviluppare questo nuovo sistema di traduzione vocale anche solo con una lingua, sono state affrontate molte sfide a partire dalla semplice raccolta dei dati, la progettazione del modello e la valutazione.
Non esistono molti traduttori umani per l'hokkien, e ciò ha complicato il tutto, così i ricercatori di Meta hanno dovuto affidarsi al mandarino come lingua intermedia, ossia si è passati per la traduzione di un contenuto vocale in inglese in un testo in mandarino, che poi è stato tradotto in hokkien e aggiunto ai dati per l'allenamento del modello.
Per arricchire i dati ci si è poi affidati a codificatori vocali precedentemente allenati, e sistemi di traduzione speech-to-unit (S2UT) per tradurre il contenuto vocale di partenza in una sequenza di unità acustiche utili, e altri sistemi complessi basati sull'IA e sui quali non ci dilungheremo. È così nato anche il primo dataset per il benchmark delle traduzioni speech-to-speech hokkien-inglese e viceversa sulla base di un corpus dell'hokkien orale chiamato Taiwanese Across Taiwan.
Meta ha in programma di utilizzare il sistema di traduzione in hokkien come parte di un traduttore vocale universale, e per farlo vuole rendere open-source il modello, il codice e i dati di utilizzati per allenare l'IA e per consentire ad altri ricercatori di aiutare il progetto portare avanti questo lavoro nel minor tempo possibile. Come si diceva sopra, per ora una persona che parla hokkien può interagire con una persona anglofona grazie alla traduzione in tempo reale di una frase per volta, ma è solo il primo passo verso un futuro in cui sarà possibile la traduzione simultanea tra le lingue.
Le tecniche utilizzate da Meta possono essere estese a molte altre lingue, sia scritte che orali, perciò molto presto sarà disponibile la matrice orale, un vasto corpus di traduzioni speech-to-speech elaborato con l'innovativa tecnica di mining dei dati di Meta, chiamata LASER, che consentirà ai ricercatori di creare i propri sistemi di traduzione speech-to-speech (S2ST) e basarsi sul lavoro fatto fino ad ora.
I progressi portati avanti da Meta nell'apprendimento automatico dimostrano che i modelli di traduzione speech-to-speech di alta qualità senza l'intervento umano sono possibili, inoltre il sistema sviluppato diminuisce la richiesta di risorse risorse necessarie rendendo i futuri lavori di traduzione con altre lingue maggiormente fruibili. Secondo Meta, la ricerca sull'IA sta aiutando a rimuovere le barriere linguistiche sia nel mondo reale sia nel metaverso, così in futuro, tutte le lingue, scritte o non scritte, non saranno più un ostacolo alla comprensione reciproca.
Meta è stata al centro delle attenzioni di recente anche per la sconfitta sulla proprietà di Giphy in seguito alla decisione dell'antitrust britannico, secondo la quale la società sarà costretta a vendere la piattaforma di caricamento e condivisione di GIF animate. Maggiori dettagli nella notizia originale linkata poco sopra
Commenti
E anche quella faccia...
Brutto nome, Facebook mi piaceva di più.
Oscuri pensieri ti attraversano.
potrei mettere un'altra parola prima di dubbioso ma mi astengo
Sei Metadubbioso
Non so perchè ma sono sempre più dubbioso quando sento parlare di "Meta"...