
17 Novembre 2021
Una piattaforma che consente di creare avatar interattivi basati sull'intelligenza artificiale: è questa, in sintesi, la definizione di Omniverse Avatar, ovvero la novità annunciata oggi nel corso della GTC da NVIDIA.
L'azienda parla di una soluzione in grado di sfruttare e conciliare tutte le più sofisticate tecnologie targate NVIDIA per creare avatar 3D interattivi e intelligenti, capaci di vedere e capire il mondo circostante e di intrattenere una conversazione su un'ampia gamma di argomenti.
Per il CEO di NVIDIA Jensen Huang si tratta dell'"alba degli assistenti virtuali intelligenti. Omniverse Avatar combina la grafica di base, la simulazione e le tecnologie AI di NVIDIA per dare vita ad alcune delle applicazioni in tempo reale più complesse mai realizzate. Gli scenari d'uso di robot e assistenti virtuali sono incredibili e di vasta portata".
E in effetti la promessa di Omniverse Avatar è proprio quella di fornire uno strumento per sviluppare una nuova generazione di assistenti virtuali. Alexa, Siri e l'Assistente Google sono voci ormai familiari per milioni di persone, e in questo senso i tempi sembrano maturi per un salto in avanti: guardando oltre NVIDIA, e considerando anche la visione avveniristica del metaverso presentata da Mark Zuckerberg, pare esserci nel settore tecnologico una certa convergenza verso le frontiere della realtà aumentata, integrata e virtuale.
Ma quali sono, nello specifico, le tecnologie che NVIDIA ha impiegato per costruire Omniverse Avatar? Cominciamo dal riconoscimento vocale, che è basato su NVIDIA Riva, ovvero un kit di sviluppo software che non solo riconosce e comprende il parlato in diverse lingue, ma elabora poi risposte vocali con un'articolazione credibile, simile a quella umana, grazie anche alle funzionalità di sintesi vocale. La vista, invece, è affidata a NVIDIA Metropolis, un framework di visione artificiale per l'analisi video.
Il cervello degli avatar è Megatron 530B, un modello preaddestrato che, anche con poche informazioni (o nessuna), è in grado di rispondere a domande spaziando all'interno di un'ampia gamma di argomenti, svolgere traduzioni, completare frasi e che ha pure il dono della sintesi dal momento che sa anche generare riassunti.
Il framework NVIDIA Merlin consente invece alle aziende di creare sistemi di deep learning capaci di gestire grandi quantità di dati con la finalità di fornire suggerimenti più intelligenti.
iPhone 15 Pro Max vs 14 Pro Max: tutte le differenze e le nostre impressioni | VIDEO
Fiat 600e, ecco come va il nuovo B-SUV elettrico | Video
Recensione Ecovacs Deebot X2 Omni: si fa quadrato ma pulisce a tutto tondo | VIDEO
Nuove Amazon Fire TV 4k ufficiali. Arriva Echo Hub, novità per Ring e Show
Commenti
Prime bisogna vedere se funziona bene
Optimus! Davvero optimus!
:D
Un cervello di nome Megatron. Andiamo bene!