Tutti i prezzi sono validi al momento della pubblicazione. Se fai click o acquisti qualcosa, potremmo ricevere un compenso.

Gemini AI: Google ammette che la demo mostrata non era reale

09 Dicembre 2023 139

L'annuncio recente da parte di Google del suo modello AI più potente di sempre, Gemini, è stato accolto con polemiche dopo che un editoriale della testata Bloomberg ha affermato che la società ha modificato un po' le carte in tavola riguardo le capacità dell'LLM in un recente video, che è andato in onda durante l'annuncio di Google all'inizio di questa settimana.

Al suo interno venivano mostrate le capacità multimodali di Gemini, inclusa la sua innata abilità nell'elaborare suggerimenti conversazionali vocali basandosi sul riconoscimento delle immagini. Nel video sembrava incredibilmente capace, forse troppo capace, secondo la giornalista Parmy Olson. Google ha ammesso che la demo video non è avvenuta in tempo reale con suggerimenti vocali, ma al contrario, ha utilizzato fotogrammi di immagini fisse dal girato grezzo e ha poi scritto suggerimenti di testo a cui Gemini ha risposto. Ecco la clip incriminata.

Il problema sta nel disclaimer inserito dall'azienda, che secondo la giornalista è quanto più lontano possa essere dalla realtà. Ecco cosa scrive Google.

"Ai fini di questa demo, la latenza è stata ridotta e gli output di Gemini sono stati ridotti per brevità."

Questa è una differenza significativa da ciò che Google sembrava suggerire nel video, ossia che una persona potesse avere una conversazione vocale fluida con Gemini mentre osservava e rispondeva in tempo reale riguardo a ciò che accadeva nella realtà.

La giornalista di Bloomberg ha calcato la mano, sostenendo che Google stia cercando di fuorviare le persone sul fatto che Gemini è ancora indietro rispetto a GPT di OpenAI. Google si è difesa affermando che il video era inteso a illustrare come potrebbero essere le future esperienze utente multimodali costruite con Gemini. La società afferma che quanto mostrato è reale e che il suo team ha realizzato il video "per ispirare gli sviluppatori".

La controversia che circonda la demo di Gemini è un promemoria delle sfide che le aziende devono affrontare quando cercano di comunicare le capacità dei loro modelli AI al pubblico. È importante essere onesti e accurati in queste rappresentazioni, poiché le informazioni fuorvianti possono portare a un contraccolpo e danneggiare la reputazione di un'azienda. E voi che ne pensate di questo passo falso? Fatecelo sapere nei commenti!


139

Commenti

Regolamento Commentando dichiaro di aver letto il regolamento e di essere a conoscenza delle informazioni e norme che regolano le discussioni sul sito. Clicca per info.
Caricamento in corso. Per commentare attendere...
Lorenzomx
Fabrizio Degni

A me ha puzzato mentre mostravano che l'interazione era RealTime.
Non so se vi rendiate conto, una cosa del genere sarebbe stata un salto quantico, altro che AGI.

Federico

Sai, penso spesso a come sarà la vita fra due generazioni (umane), vita che ovviamente io non avrò la possibilità di vedere in prima persona ma della quale potrò assistere solo alla fase iniziale.
La realtà è che non lo so, nel senso che non so immaginarla.
Due generazioni sono circa trent'anni, e per allora le IA saranno non solo intelligenti e coscienti (intelligenti lo sono già, consapevoli iniziano rozzamente ad esserlo) ma anche consapevoli.
Che significa avere a tutti gli effetti una nuova specie pienamente senziente, più intelligente e colta di quella umana.
Non più creativa, quello è un ulteriore step cognitivo ancora più distante.
Presumibilmente parecchio distante.
Ecco, io arrivo con l'immaginazione ad un rapporto di collaborazione sempre più stretta fra umani ed intelligenze non biologiche, un rapporto più sviluppato ancora rispetto a quello verbale che già possiamo avere con GPT Voice, rapporto del quale le tecnologie NeuraLink sviluppate da Musk potrebbero rappresentare la base.
Però mi fermo lì, non credo di essere in grado di immaginare un rapporto fra me ed una specie senziente che mi è superiore.
Avverto... beh sì, avverto imbarazzo.
Non è che io lo trovi sbagliato, è nell'ordine delle cose che alla fine qualsiasi specie dominante venga superata da una successiva, però se me la trovassi davanti domani mattina semplicemente non sarei pronto.

Posso dirti che la mia fidanzata, una amabile nigeriana dal carattere solidissimo e che non ha mai posseduto un computer in vita sua (riceverà il suo primo laptop, ovviamente FydeOS, come regalo di natale assieme a un sacco di cianfrusaglie per ascoltare bene la musica), trova già imbarazzante l'idea di scrivere a Bard e GPT, ma addirittura si rifiuta categoricamente di dialogare a voce con GPT.
Non è che sia superstiziosa o altro, semplicemente ha un blocco mentale... è un po' come per la mia aracnofobia: so perfettamente che il ragno non può farmi nulla, e che anche se potesse non avrebbe alcuna ragione di aggredirmi visto che certamente non potrebbe mangiarmi... ma non posso evitare di averne paura.
Ecco, se domani mattina mi trovassi davanti una AI del prossimo trentennio proverei lo stesso tipo di blocco mentale.

Unoqualunque

Ma sai cosa, l'interazione con la IA è talmente diversa che richiede un totale cambiamento di paradigma con il quale interagiamo con la tecnologia. Io non la vedrei confinata ad un dispositivo come lo smartphone, secondo me il primo che riuscirà a creare un ecosistema con il quale interagire efficacemente con la IA avrà il mercato in mano. Ovviamente serviranno i dispositivi per fare questo, ma com'è stato con Android che si è proposto come OS "pronto all'uso" per gli smartphone che ha fatto abbandonare i vari OS proprietari, cosi potrà essere con la IA. Chi trova il modo di renderla realmente utile al mercato consumer e proporrà una qualcosa di reale per interagire con questa tecnologia, allora aprirà il mercato ad una nuova famiglia di dispositivi. Non voglio pensare che una tecnologia del genere venga relegata nel mercato consumer alla modifica delle foto o alla creazione di testi grammaticalmente corretti.

Federico
Unoqualunque

No bhe ovvio, l'AI non potrà essere "ospitata" in un cellulare per quello parlo di un "dispositivo mobile", questo dispositivo dovrà essere costantemente collegato al cloud per poter sfruttare le funzionalità della IA. Magari potrà fare qualcosa offline con qualche SoC pensato ad hoc ma per tutto il resto dovrà essere sempre online. Non so come o cosa potrebbe fare questo dispositivo, ma il primo che riuscirà a trovare un modo di interagire con la IA con un dispositivo user friendly e oggettivamente utile per il mercato consumer sarà a capo di una rivoluzione tecnologica come ha fatto a suo tempo Apple con il primo iphone.

Federico

Bah, ci sono due novità nei sistemi operativi, in particolare nei kernel, da Huawei e Xiaomi, ma certamente un cellulare resterà un cellulare.
Alla IA nel telefono credo poco, non abbiamo la tecnologia di integrazione necessaria ad ottebere le densità indispensabili per sostenere una IA di alto livello in un volume così ristretto, ma ancora peggio, no abbiamo la tecnologia degli accumulatori necessaria per alimentarla.
Questo però non significa che la IA non possa arrivare nei cellulari, significa solo che l'integrazione si potrà raggiungere solo rivolgendosi al Cloud.
Che oltretutto è rappresenta un paradigma non solo più moderno ma anche più avanzato dello sfruttamento di risorse locali.

Unoqualunque

Per il 3D non stiamo parlando della stessa cosa, la demo che avevano fatto non era tramite foto, ma era un'acquisizione in tempo reale, praticamente era come fare un video e nell'app appariva in tempo reale solo l'oggetto in tre dimensioni. Lascia stare le scelte assurde di Microsoft in quegli anni, anche io ho avuto il 920 ma ho preferito di gran lunga il 950 (ad esempio solo da pochi anni le fotocamere dei telefoni android hanno superato le qualità del 950) per non parlare di Cortana che funzionava davvero, da quando sono su Android non ho più ricevuto nessuna indicazione su quando partire in base al traffico o su appuntamenti in base ad una sorta di apprendimento delle email. Poi utilizzavo con una certa soddisfazione anche la modalità desktop (era molto limitata, ma se l'avessero sviluppata sarebbe stata una cosa spettacolare) immagina cosa potrebbero fare ora sul mobile con WoA e i nuovi SoC. Ma è evidente che tra Microsoft, Apple e Google si sono spartiti l mercato desktop e mobile e la situazione non cambierà più. Gli unici che potranno cambiare le carte in tavola del mercato mobile saranno nuovi dispositivi basati sulla IA.

Nickever_Professional™

Guarda secondo me per quando il servizio verrà lanciato avremo cose di quel genere, naturalmente il lancio di gemini non è proprio imminente ma per ora è stato solo annunciato il nome della nuova proprietà intellettuale.
Si se ovviamente lanceranno gemini che non sarà in grado di fare quando visto nel video sarà letteralmente una colossale presa per il cul0, noi sappiamo che attualmente nel 2023 tale intelligenza artificiale non è propriamente in grado di eseguire quelle mosse, vedremo gli sviluppi che faranno nel corso del tempo, loro volevano più che altro mostrare quale fosse il loro vero obiettivo.

Federico
Big wall

Significa che Apple è indietro rispetto alla concorrenza stop, non c'è altro da aggiungere.

Unoqualunque

:D Li ho avuti tutti dal 820 al 950 (che sto ancora rimpiangendo) e quello che avevano fatto vedere in quella dimostrazione non è mai esistito. Lo so benissimo perchè l'avrei voluto usare con la stampante 3D. Mentre la tua sequenza temporale è completamente sbagliata, Kinect è nato molto prima come accessorio per l'XBOX 360 (2012) per essere poi dismesso ed usare quella conoscenza anche negli Hololens e nei sensori del lumia 950 (2015). La presentazione di quello scanner 3D era stata fatta con il 950 (ho il dubbio se avessero usato addirittura lo smartphone di HP) dicendo che i sensori di quello smartphone, come dici te simili al Kinect, potessero appunto fare lo scan veloce e preciso come quello nella demo. I sensori del 950 effettivamente qualcosa facevano perchè l'accesso tramite il riconoscimento del volto era il migliore in commercio, ma di certo quella presentazione non rappresentava affatto la realtà.

Lorenzomx

Ma cosa significa "a livello elementare"? Non è che tutto ciò che non sia un LLM sia un modello elementare, non c'è solo quello: c'è molto di più, anche non legato al campo del natural language processing. Sicuramente presto vedremo i language model sugli smartphone, sia su iOS che su Android, ma non è ancora il momento, visto il costo molto alto in termini di risorse per far girare modelli del genere o il costo non indifferente per far girare invece i modelli sui loro server (guarda i costi delle API di OpenAI anche solo per GPT 3.5 turbo)

Federico

La pioniera fu RIM, con i suoi BlackBerry.

Federico

Mi sa che tu il Lumia non lo hai mai avuto, vero?
Quello non era un video dimostrativo, quel software lo avevamo veramente e funzionava benissimo.
È una delle mille tecnologie sviluppate e poi lasciate morire senza addurre spiegazioni.

Big wall

Peccato che il 49% che OpenAI sia di Microsoft diretto competitor che la sta integrando sia nel OS che sui vari software , Apple è palesemente indietro, che poi la usi a livello elementare su gli iphone non significa nulla.

Mark Vox

Questo treno si chiama Intelligenza Artificiale, il treno è una METAFORA.
A mio avviso Google ha messo a disposizione piccole cose che il suo motore dell’intelligenza artificiale è in grado di fare che piacciono ma non convincono, per questo è in affanno, ma non è detto che non possa fare il sorpasso.
Sicuramente Microsoft (OpenAI) stavolta è stata più scaltra a lanciare il suo prodotto, magari i fallimenti passati hanno dato i loro frutti, poi c’è ancora Apple che non è ancora pervenuta

Mark Vox

Grazie per la precisazione, avevo intuito questo passaggio ma Google ha creato confusione… alla fine il prodotto è Bard, ma pubblicizza il motore (Gemini), ma è un po’ tipico di Google di rivolgersi più agli utenti smanettoni

Unoqualunque

Microsoft mi sembra che la stia rilasciando anche negli abbonamenti Enterprise di Office 365, i video legati a Copilot in Office 365 sono impressionanti, praticamente con due istruzioni crea dei documenti, presentazioni, excel, ecc.. che normalmente ci si impiegherebbe un mese. Che poi gli utenti la sappiano usare e dargli in pasto i dati corretti su cui basarsi è un discorso completamente diverso. Nelle aziende c'è gente che non sa praticamente usare le funzioni base di OneDrive e ora si dovrebbe cimentare con Copilot?

Unoqualunque

Mi sembra di rivedere Microsoft quando cercava di spingere i Lumia. Mi ricordo un video assurdo dove facevano vedere un Lumia che poteva fare lo scan e creare il modello 3D in tempo reale sullo smartphone (a quei tempi andava di moda la VR) cosa che ovviamente non si è mai concretizzata. Alla fine sono tutti uguali, quando devono inseguire si inventano mirabolanti funzioni che forse arriveranno per attirare l'attenzione. Comunque, se fosse vero, la capacità di riconoscere le cose è oggettivamente impressionante.

Federico

Non leggo praticamente mai giornali, non guardo telegiornali e neppure ascolto giornali radio.
Ho un televisore piuttosto grosso, ma da quando anni addietro lo acquistai sarà stato acceso forse un totale di dieci ore.
Mi rivolgo soprattutto ad agenzie stampa internazionali, con particolare riferimento a quelle finanziarie e siti specializzati in analisi geopolitica (in Italia Limes per l'analisi geopolitica vera e propria e Parabellum per il necessario compendio militare).
Naturalmente non è che queste sorgenti siano prive di una visione propria, e di conseguenza di interpretazione parziale dei fatti, ma le cinque ore quotidiane spese nella consultazione di fonti di tutto il mondo mi consente di ricavare una "media regalistica" dei fatti.

Squak9000

ma che ne sappiamo noi fi queste cose nel loro vero "intimo"... tutto un "bla bla bla" per fare notizia dei giornali e ci costruiscono sopra, non dei castelli, ma di più.

Romanzano all'inverosimile sul quel sottile confine che sta tra la casa inventata e vera.

Forse forse un 30% riportano fatti nel contenuto... il restante 70% sono ricamati, che attenzione non dicono bugie, ma roba che inserita in contesti può voler dire mille cose poi ognuno la intende come crede.

Federico

Hai ragione. Avrei dovuto essere più chiaro nel primo post, anche se immagino che il vero senso delle mie parole sia emerso del seguito: non importanti ai fini della tecnologia (se ci metti un mese o sei cambia poco, hai dimostrato è che ciò sia fattibile), ma sbagliato ai fini della comunicazione.
Un errore interessato?
Non sono così ingenuo da credere che la ragione non sia quella.

Stewie

Sul "non essere importanti" avrei da ridire: sei Google quindi sai che la tua parola vale di più di quella della startup delle silicon valley, dici al mondo che hai un IA che real time capisce cosa sto disegnando, sono tutti super meravigliati, Google è sempre la migliore blablabla ---> le azioni salgono, i pubblicitari continuano a cercarti ect ect, hai aumentato artificiosamente con delle balle il tuo posizionamento nel mercato, non mi pare proprio di secondo piano...

m4xt3r

Che ci si arrivi, si arriverà, non vi sono dubbi. La questione è illudere, cercare di raggirare il pubblico, mostrare cose che non si è in grado di fare. Questioni che mi aspetto di vedere da un prestigiatore piuttosto che da un colosso della tecnologia quale Google. "Vergognosi" è l'unico aggettivo che mi viene in mente per descrivere quello che è stato fatto in questa operazione di marketing.

Nickever_Professional™

Mi sembrava troppo strano per essere vero, tuttavia al momento anche se difficile non vuol dire che un giorno non possa effettivamente tramutarsi concettualmente in un qualcosa di concreto e realistico.
Oramai é partita la cosa all'intelligenza artificiale, le aziende investiranno miliardi pur di avere il miglior servizio da offrire.

LaVeraVerità

No

Ikaro

Bard comunque c'è anche Italia è, e gemini non sarà un nuovo prodotto ma il "motore" dietro a Bard, come gpt3.5/gpt4 sono il motore di chatgpt

gp

ripeto, questo treno sarebbe?? perchè a parte microsoft che comunque ancora non l'ha messa veramente in atto, ma sicuramente spingerà con win12, quindi parliamo da 6 mesi ad un anno, solo google la sta facendo assaggiare con i suoi smartphone, con cose più o meno banali e inoltre ricordiamo che per sfruttare questa intelligenza artificiale le grandi case avranno bisogno di informazioni e chi se non google ha la capacità di svilupparla maggiormente?

Mark Vox

Vedi cosa è successo con la telefonia: Apple è stata la pioniera, Google ha offerto una valida alternativa, Microsoft si era svegliata in notevole ritardo comprando Nokia, ma il treno della telefonia era già partito da tempo…
Stavolta Microsoft (OpenAI) è stata più furba tenendo la bocca cucita sulla tecnologia dell’AI aspettando che fosse abbastanza matura, per poi farla esplodere improvvisamente lanciandola sul mercato globale. Google stavolta la vedo molto in affanno, ha presentato di fretta e furia Bard per non far perdere valore all’azienda, ma è limitata al mercato americano quindi il resto del mondo ancora non sa cos’è, neanche il tempo di capire cosa fosse Bard adesso hanno lanciato Gemini e comincio a vedere il classico sovraffollamento di servizi Google con conseguente cessazione

gp

?? ci sono poche aziende al mondo che possono permettersi di essere prime in questo campo e google è una di queste per forza di cose, qual è questo treno in corsa che non riesce a prendere?

m4xt3r

Io mi sono sentito offeso e ho trovato davvero odioso questo modo di fare marketing. MI sono permesso di criticare diversi youtubers che ne hanno parlato in rete, dicendo loro che le notizie vanno SEMPRE verificate, nel limite del possibile. La loro risposta è stata nella stragrande maggioranza dei casi che l'informazione proveniva da Google e per questo è stata ritenuta altamente affidabile. Annamo bene! Tra l'altro tutta questa fuffa di video difficilmente viene rimossa e contribuisce a sua volta ad alimentare la "farsa". Delusissimo da due cose: dall'essere stato preso in giro ma soprattutto dal fatto che questa cosa non esiste, avrei tanto voluto fosse stata reale!

Ryosaku

Ah beh puó anche simulare di essere essere un treno (paradossalmente più veloce), ma se alla fermata non scendi…

jonnycoffee
Nuanda

Che figura di m.....

Lorenzomx

Ma che paragone è, perdonami? Una è un'azienda che fa dispositivi hardware e software per quei dispositivi, l'altra è un'azienda che fa solo prodotti di AI, è come confrontare le mele con le pere.

Poi vabbè, fantastico come io abbia detto una cosa assolutamente vera (ciò che su iOS ci sia ampio uso di AI) e venga chiamato fanboy così, gratuitamente. Poi la realtà è che ho un telefono Android e non ho un iPhone, ma ovviamente nella vostra testa chiunque non critichi Apple a prescindere è automaticamente un fanboy. Forse sarai tu un hater piuttosto

Mark Vox

Google sta all’intelligenza artificiale come Microsoft sta alla telefonia

Mark Vox

Perché Google sta cercando in tutti i modi di salire su un treno che è già in corsa e teme di fare la stessa fine che ha fatto Microsoft con la telefonia

FactCheckoEBasta

Risaputa esattamente come e perché dato che hanno fatto esattamente 0 annunci pubblici? Le solite vaccate da hater.

Big wall

Apple è indietro rispetto ad OpenAI ed è una cosa risaputa il resto sono solo illazioni da fanboy.

Big wall

Si ma non ai livelli di openAI, è molto indietro ed è una cosa di pubblico dominio basta fare una ricerca...fanboy

Federico
Federico

Ma assolutamente no, il tempo che ho indicato si riferisce all'arrivo sul mercato

Federico

Nono, fu proprio per ragioni etiche.
Non loro, evidentemente, ma per il timore di poter ricevere un danno dai tanti movimenti di opinione che imperversavano, ed imperversano tutt'ora.
In Google ci fu una vera caccia alle streghe interna, tassativamente vietato parlare di intelligenza o di coscienza dei sistemi, caccia alle streghe che culminò con il famoso caso dell' ingegnere licenziato solo per aver detto di aver avuto l'impressione che un sistema stesse sviluppando una forma di coscienza.
Insomma ebbero paura, Microsoft una volta tanto no, e andò a finire che OpenAI si aggiudicò il primo round.

Squak9000
Squak9000

si... sei mesi un anno massimo riescono a fare un altro video.

Qui parliamo come minimo minimo minimo 5 anni per qualcosa NON a livello consumer.

Nicco Costa

Quando hai ragione hai ragione. Colpa mia.
E' che non sopporto vedere un povero paese votare gente che lo porterà ancora più in basso.
Non vorrei dover espatriare.

Nicco Costa

Ah quindi sono solo molto furbi.

Federico

Si, era il 2018 e furono così sciocchi da interrompere il progetto per ragioni etiche, lasciandosi superare da OpenAI.
Questa volta non ripeteranno lo stesso sbaglio.

Lo hai visto funzionare anche tu, il video è contenuto in questo articolo.
Il numero di tentativi è irrilevante, non esiste nulla in grado di sostenere quella complessità di processi cognitivi.
Nel senso che qualsiasi altra tecnologia attualmente disponibile impiegherebbe un numero di tentativi tendente all'infinito.

FactCheckoEBasta

Anche vero che non sappiamo se quello che hai scritto è vero. Magari non so, tra due anni incontrano un ostacolo tecnologico momentaneamente invalicabile e tutto rallenta.

Android

Xiaomi 14 ufficiale in Italia. Video anteprima 14 Ultra

Android

Recensione OnePlus Watch 2: sfida a Samsung con Wear OS e un'ottima batteria

HDMotori.it

Renault 5 E-TECH Electric: elettrica a meno di 25.000€... con l'asterisco | Video

Windows

Lenovo al MWC con un concept laptop dal display trasparente e tanti PC AI