Google conta da solo GPT-4 concorrente, Gemelli, tanto da mettere in scena parti di un recente video dimostrativo. In un articolo d’opinione, Bloomberg afferma che Google lo ammette per il suo video intitolato “Pratico con Gemini: interagire con l’intelligenza artificiale multimodale” non solo è stato modificato per velocizzare gli output (come dichiarato nella descrizione del video), ma l’interazione vocale implicita tra l’utente umano e l’IA era in realtà inesistente.
Invece, la demo vera e propria è stata realizzata “utilizzando fotogrammi di immagini fisse dal filmato e suggerimenti tramite testo”, anziché far sì che Gemini rispondesse – o addirittura prevedesse – un disegno o un cambiamento di oggetti sul tavolo in tempo reale. Ciò è molto meno impressionante di quanto il video voglia indurci a pensare e, peggio ancora, la mancanza di disclaimer sull’effettivo metodo di input rende Gemini’s prontezza piuttosto discutibile.
Non sorprende che Google neghi qualsiasi illecito qui, come ha riferito Il limite a un post su X scritto dal co-responsabile di Gemini, Oriol Vinyals, in cui si afferma che “tutti i suggerimenti e gli output degli utenti nel video sono reali” e che il suo team ha realizzato il video “per ispirare gli sviluppatori”. Considerata l’attenzione dell’industria e delle autorità nei confronti dell’intelligenza artificiale negli ultimi tempi, forse il colosso della tecnologia dovrebbe essere più sensibile riguardo alle sue presentazioni in questo campo.
Sono davvero felice di vedere l’interesse attorno al nostro video “Hands-on with Gemini”. Nel nostro blog degli sviluppatori di ieri, abbiamo analizzato il modo in cui Gemini è stato utilizzato per crearlo. https://t.co/50gjMkaVc0
Abbiamo dato a Gemini sequenze di diverse modalità – immagini e testo in questo caso – e gli abbiamo fatto rispondere… pic.twitter.com/Beba5M5dHP
— Oriol Vinyals (@OriolVinyalsML) 7 dicembre 2023