Notizia @xguntherc
22 aprile 2023, 10:24 EST | 1 minuto di lettura
NVIDIA Nel caso non lo sapessi, l’IA generativa sta prendendo il sopravvento ovunque. C’è una novità ChatGPT storia che appare ogni giorno, e tutti i principali attori sta saltando nello spazio. Ora, NVIDIA mostra il suo impressionante generatore AI text-to-video.
la divisione Toronto AI Lab di NVIDIA di recente lanciato un sito web e ha pubblicato un documento di ricerca con alcuni ottimi risultati. Il progetto “Sintesi video ad alta risoluzione con modelli di diffusione latente” può trasformare il testo in video o GIF in pochi secondi. Meglio ancora, può farlo pur essendo efficiente dal punto di vista computazionale e producendo comunque file ad alta risoluzione.
Tuttavia, in quasi tutti gli esempi, è relativamente facile vedere che la fonte delle sue immagini proviene direttamente da Shutterstock. Naturalmente, è importante ricordare che questa è ancora una tecnologia emergente e per ora solo un progetto di ricerca, ma solleva ancora una volta la questione dell’intelligenza artificiale e del diritto d’autore.
Firefly AI di Adobe crea delle opere d’arte piuttosto sbalorditive, cosa che dice succede senza problemi di copyright. O, questa è l’idea, almeno. Anche Shutterstock stessa di recente lanciato il proprio strumento di intelligenza artificiale per cercare di combattere il problema.
Ad ogni modo, è interessante vedere quasi tutti i campioni di NVIDIA con una filigrana Shutterstock o linee sfocate dove sarebbe. A parte questo, lo strumento sputa ancora alcuni brevi video di 4 secondi piuttosto impressionanti.
Secondo NVIDIA, lo strumento si basa sulle attuali tecnologie di generazione di testo in immagini come Stable Diffusion. Aggiungendo altre dimensioni al modello, otteniamo risultati realistici. Ad esempio, NVIDIA ha chiesto allo strumento AI di “realizzare un video di una Panda in piedi su una tavola da surf nell’oceano al tramonto, in alta definizione 4K”. Quello che vedete qui sotto è il risultato che ha prodotto.
NVIDIA
Ancora una volta, gli spettatori con gli occhi d’aquila vedranno un contorno sfocato del logo Shutterstock. Quindi, sebbene il video sia estremamente realistico e lo strumento abbia creato un video con risoluzione HD 1280×2048 della durata di 4,7 secondi, tutto da una riga di testo, non è ancora perfetto.
Campioni specifici dal sito Web mostrano artefatti intorno alle mani, specialmente quando l’IA sta cercando di realizzare un video con molto movimento. Inoltre, è sempre sfocato proprio intorno a dove si trova il logo Shutterstock. Gli artefatti e le filigrane rendono lo strumento più adatto per piccole GIF e miniature, ma in futuro tutto è possibile.
Ad ogni modo, digitare poche righe di testo in uno strumento AI e ottenere video utilizzabili in HD è sicuramente impressionante. Inoltre, tieni presente che questa è la peggiore foto e video AI mai visti. Da qui in poi tutto continuerà a migliorare o a diventare ancora più convincente.
attraverso TechRadar