L’ultima suite di intelligenza artificiale di Meta rende la traduzione vocale più fluida ed espressiva

Di Alessio Perini 2 minuti di lettura
l’ultima-suite-di-intelligenza-artificiale-di-meta-rende-la-traduzione-vocale-piu-fluida-ed-espressiva
L’ultima suite di intelligenza artificiale di Meta rende la traduzione vocale più fluida ed espressiva

Ad agosto, Meta ha presentato il suo modello di traduzione AI multimodale, Senza soluzione di continuitàM4T, che supporta quasi 100 lingue per il testo e 36 per il parlato. Con un’architettura “v2” aggiornata, il gigante della tecnologia è ora espansione su questo strumento per rendere le traduzioni conversazionali più spontanee ed espressive: quest’ultima è una chiave mancante per un’autentica conversazione attraverso le lingue.

La prima delle due nuove funzionalità è “SeamlessExpressive” che, come puoi capire dal nome, trasferisce le tue espressioni nel tuo discorso tradotto. Questi includono il tono, il volume, il tono emotivo (eccitazione, tristezza o sussurri), la velocità del discorso e le pause. Considerando che fino ad ora i discorsi tradotti sono sempre sembrati robotici, questa svolta è potenzialmente un punto di svolta, sia nella nostra vita quotidiana che nella produzione di contenuti. Le lingue supportate includono inglese, spagnolo, tedesco, francese, italiano e cinese, sebbene il pagina dimostrativa mancano l’italiano e il cinese al momento della stesura di questo articolo.

La seconda funzionalità è “SeamlessStreaming”, che avvia la traduzione di un discorso mentre l’oratore sta ancora parlando, consentendo così agli altri di ascoltare la traduzione più velocemente. C’è ancora una breve latenza di poco meno di due secondi, ma almeno non dovrai aspettare che qualcuno finisca una frase. Secondo Meta, la sfida qui è che lingue diverse hanno strutture di frasi diverse, quindi è stato necessario sviluppare un algoritmo dedicato allo studio dell’input audio parziale, al fine di decidere se c’è abbastanza contesto per iniziare a generare un output tradotto o se continuare ad ascoltare .

L’ultimo sviluppo di Meta su questa suite “Seamless Communication” sembra essere impressionante, più degli strumenti di interpretariato mobile offerti da aziende del calibro di Google E SAMSUNG. Non si sa quando il pubblico sarà in grado di utilizzare queste nuove funzionalità, ma posso già immaginare Meta che le inserirà nel suo occhiali intelligenti un giorno, rendendoli ancora più pratici che mai.

TAGGATO:
Condividi questo articolo
Exit mobile version