Google sta lanciando una serie di aggiornamenti sul fronte dell‘intelligenza artificiale generativa, incluso un nuovo strumento di conversione del testo in immagine. In cosa c’è di diverso ImageFX è che ha un’interfaccia che presenta “chip espressivi”. L’idea qui è che questi ti aiuteranno a “sperimentare rapidamente le dimensioni adiacenti della tua creazione e delle tue idee”.
Oltre al debutto di ImageFX, Google afferma di aver migliorato MusicFX e TextFX. L’azienda afferma di aver apportato aggiornamenti al modello MusicLM che includono una generazione più rapida di musica e audio di qualità superiore, insieme a nuove funzionalità. I brani generati ora possono durare fino a 70 secondi. Quanto a TextFXGoogle ha implementato aggiornamenti sull’usabilità con l’obiettivo di migliorare la navigazione e l’esperienza complessiva dell’utente.
Le immagini e l’audio generati da ImageFX realizzati con MusicFX sono contrassegnati da SynthID, una filigrana digitale che mira a chiarire che questi sono contraffatti utilizzando l’intelligenza artificiale, soprattutto quando compaiono in Ricerca o Chrome. Le creazioni ImageFX includeranno anche i metadati IPTC. Questo, secondo Google, offrirà “alle persone più informazioni ogni volta che incontreranno le nostre immagini generate dall’intelligenza artificiale”
Persone negli Stati Uniti, Kenya, Nuova Zelanda e Australia possono provare questi strumenti nuovi e rinnovati nell’AI Test Kitchen a partire da oggi. Per ora sono disponibili solo in inglese.
Il modello Imagen 2 alimenta le nuove funzionalità di generazione di immagini di ImageFX. È anche la tecnologia che sta guidando nuove opzioni di intelligenza artificiale generativa a Bard, Ricerca, Annunci, Duet AI nell’area di lavoro e Vertex AI. Google afferma che Imagen 2 aiuta a fornire le immagini generate dall’intelligenza artificiale della massima qualità mai viste. L’azienda osserva che il modello aiuta a mantenere le immagini libere da artefatti e migliora le aree di generazione delle immagini con cui tali strumenti hanno lottato fino ad ora.
Inoltre, Google afferma di aver fatto “investimenti significativi” nella sicurezza dei dati di formazione di Imagen 2, aggiungendo al contempo guardrail per “limitare risultati problematici come violenti, offensivi o contenuti sessualmente espliciti oltre ad applicare filtri per ridurre il rischio di generare immagini di individui nominati.Ciò è dovuto alla capacità migliorata del modello di generare immagini fotorealistiche. L’azienda afferma di effettuare anche “test contraddittori approfonditi” per rilevare e reprimere contenuti potenzialmente problematici e dannosi.
Altrove, Gemini Pro a Bard è più ampiamente disponibile a partire da oggi. Suo ora accessibile in più di 40 lingue e in oltre 230 paesi e territori. Inoltre, ad oggi, Google afferma che le persone nella maggior parte dei paesi possono generare immagini in Bardo in inglese gratuitamente. Queste immagini includeranno filigrane SynthID.