ChatGPT, la nuova versione del chatbot basato sull'IA riconosce immagini e voci

25 Settembre 2023 2

La nuova versione di ChatGPT rappresenta un salto in avanti molto importante per il chatbot basato sull'intelligenza artificiale di OpenAI che ora è in grado di riconoscere il contenuto delle immagini e dialogare con gli utenti grazie alla combinazione tra riconoscimento vocale e sistema text-to-speech Whisper.

Per il momento il riconoscimento vocale sarà disponibile solo su iOS e Android, mentre il riconoscimento delle immagini potrà essere utilizzato su tutte le piattaforme. La distribuzione delle nuove funzionalità avverrà nel corso di un paio di settimane e sarà inizialmente riservata ai soli utenti Plus e Enterprise, ma secondo quanto riportato nell'annuncio di OpenAI dovrebbe presto risultare disponibile anche nella versione gratuita dell'applicazione.

L'aggiunta del riconoscimento vocale rende possibile interagire con ChatGPT come si fa con un assistente vocale, pronunciando domande e risposte con la propria voce. Certo, il chatbot di OpenAI manca dei servizi di Amazon o Google, ma grazie all'intelligenza artificiale può interagire con gli utenti in modo articolato, rispondendo in modo coerente a domande e richieste. Ed è proprio il tipo di interazione a cui Amazon sta lavorando per Alexa, in procinto di diventare più reattiva e intuitiva proprio grazie all'intelligenza artificiale.

Per attivare le funzionalità vocali di ChatGPT, come anticipato per ora disponibili solo sulle piattaforme iOS e Android, è sufficiente accedere alla scheda delle nuove funzionalità dell'applicazione e abilitare le conversazioni. A questo punto è possibile scegliere quale voce dare all'intelligenza artificiale scegliendo tra le cinque che ci vengono proposte toccando l'icona delle cuffie che si trova nell'angolo in alto a destra nella schermata principale.

In tutto questo OpenAI disporrebbe anche di tecnologie in grado di creare una voce sintetica imitando una voce reale. Sta infatti lavorando con Spotify a uno strumento per tradurre automaticamente i podcast mantenendo toni e inflessioni delle voci originali. Ma per il momento ha deciso di limitare l'accesso a questa tecnologia da parte del grande pubblico, per il timore che venga utilizzata per impersonare qualcuno o per organizzare truffe.


Oltre a poter conversare con gli utenti, la nuova versione di ChatGPT è in grado di riconoscere gli oggetti ritratti nelle immagini caricate dagli utenti e di rispondere di conseguenza. Ed è possibile effettuare e modificare in corsa richieste relative all'immagine così come utilizzare lo strumento di disegno dell'applicazione per rendere più chiare eventuali domande legate all'immagine in questione. Non è invece possibile, per ovvie questioni di privacy legate di possibili utilizzi malevoli della tecnologia, chiedere a ChatGPT di identificare una persona.


2

Commenti

Regolamento Commentando dichiaro di aver letto il regolamento e di essere a conoscenza delle informazioni e norme che regolano le discussioni sul sito. Clicca per info.
Caricamento in corso. Per commentare attendere...
E K

Tutti quelli che lavorano nel terziario e non hanno un lavoro creativo di alto livello molto probabilmente.

pollopopo

Il momento io cui riusciranno a spendere poca energia per questo genere di elaborazione finiamo tutti a fare la calza

Recensione Lenovo Tab Extreme: per la produttività ma anche l'uso multimediale

Recensione Realme 11 5G: ottima autonomia ma con alcuni limiti | VIDEO

Recensione OnePlus Open: il paradosso dei Fold | VIDEO

Il miglior cameraphone del 2023: le vostre e le nostre scelte | VIDEO