Come scrivere un fantastico prompt di diffusione stabile

Di Redazione FinanzaNews24 14 minuti di lettura
come-scrivere-un-fantastico-prompt-di-diffusione-stabile

Gli Adirondack al tramonto durante l’autunno. Solo che questa immagine è un falso prodotto in 18,5 secondi. Diffusione stabile, un popolare generatore di arte AI, richiede istruzioni di testo per creare un’immagine. A volte fa un lavoro straordinario e genera esattamente quello che vuoi con un vago prompt. Altre volte, ottieni risultati non ottimali. Ecco alcuni suggerimenti e trucchi per ottenere risultati ideali.

Se hai passato del tempo con generatori di immagini AI, come Stable Diffusion, DALL-E o A metà viaggio, avrai notato che un prompt ben formulato critico. Un suggerimento ben formulato è la differenza tra trasformare la tua idea in una grande immagine e ottenere una mostruosità da valle misteriosa con troppe dita che ti fissano.

Le persone hanno cercato di scoprire i modi migliori per ottenere risultati ideali da quando Stable Diffusion è stato lanciato nell’agosto 2022 e saranno “prompt smithing” o “prompt engineering” per gli anni a venire. Ciò è particolarmente probabile poiché i checkpoint che informano il modo in cui Stable Diffusion genera le immagini riceveranno aggiornamenti periodici. Il suggerimento ideale sarà un obiettivo mobile per il prossimo futuro.

Aggiornamento, 23/12/22: L’ultima versione di Stable Diffusion al momento di questo aggiornamento, la versione 2.1, risponde molto bene alle richieste negative. I prompt negativi sono proprio come il normale prompt, ma invece di descrivere ciò che vuoi, descrivi ciò che vuoi non volere. Prova a generare il tuo primo set di immagini senza messaggi negativi, quindi aggiungi messaggi negativi per rimuovere gli elementi che non ti piacciono. RELAZIONATO: I migliori generatori di immagini AI che puoi usare in questo momento

Sii il più specifico possibile Stable Diffusion tende a prosperare su prompt specifici, specialmente se paragonato a qualcosa come MidJourney. Devi dirlo Esattamente ciò che vuoi. Ecco un esempio che utilizza gli animali preferiti di Internet: Gatti carini.

Prompt: “Cute Cat”, Sampler = PLMS, CFG = 7, Sampling Steps = 50 Va bene, sono piuttosto carini, tranne forse per il poveretto in alto al centro che sembra aver passato troppo tempo a fissare l’abisso. Ma cosa succederebbe se volessi gatti grigi, non un mix di gatti? Beh, devi specificarlo. Usa “Carino grigio gatti” come prompt invece.

Prompt: “Cute Grey Cat”, Sampler = PLMS, CFG = 7, Sampling Steps = 50 Ora Stable Diffusion restituisce tutti i gatti grigi. Puoi continuare ad aggiungere descrizioni di ciò che desideri, incluso l’accessorio per i gatti nelle immagini.

Prompt: “Carino gatto grigio con occhi azzurri, che indossa un papillon”, Sampler = PLMS, CFG = 7, Sampling Steps = 50 Questo vale per tutto ciò che vuoi che Stable Diffusion produca, inclusi i paesaggi. Sii descrittivo e mentre provi diverse combinazioni di parole chiave, tieni nota mentalmente di come cambia l’immagine. Alcune parole e frasi tendono a influenzare più fortemente un’immagine rispetto ad altre parole, quindi potrebbe essere necessario modificare la richiesta di conseguenza.

Assegna un nome a stili o mezzi artistici specifici La necessità di specificità non finisce quando descrivi completamente il contenuto dell’immagine che desideri. Puoi (e dovresti) anche specificare lo stile che desideri. Seguiremo il nostro prompt “Gatto grigio carino” per questo. Diciamo che vogliamo dei simpatici gatti grigi, ma vogliamo anche che sembrino un dipinto acrilico. La prima cosa che dovresti provare è aggiungere “pittura acrilica” come parola chiave successiva nel tuo prompt, quindi dovrebbe leggere: “Carino gatto grigio, pittura acrilica”.

In genere è meglio iniziare con il minor numero di parole chiave per avvicinarsi a ciò che si desidera, quindi aggiungerne altre per concentrarsi sull’estetica che si sta cercando.

Prompt: “Gatto grigio carino, pittura acrilica”, Sampler = PLMS, CFG = 7, Sampling Steps = 50 La diffusione stabile riconosce decine di stili diversidai disegni a matita ai modelli in argilla fino al rendering 3D di Unreal Engine.

Prompt: “Cute Grey Cat, Unreal Engine rendering”, Sampler = PLMS, CFG = 7, Sampling Steps = 50 Questi suggerimenti di esempio sono estremamente semplici, ma puoi utilizzare dozzine di parole chiave per perfezionare i risultati. Se vuoi modelli di pollo in argilla strani e dai colori psichedelici in un Walmart, devi specificarlo Tutto quei termini.

Prompt: “busto di un pollo in un Walmart, modello in creta, (colori psichedelici), fusione, strano” Sampler = PLMS, CFG = 7, Sampling Steps = 150 Nomina artisti specifici per guidare la diffusione stabile Stable Diffusion è in grado di fare di più che emulare stili o mezzi specifici; può persino imitare artisti specifici se vuoi farlo. Questo esempio ha utilizzato Pablo Picasso.

Dovresti assolutamente provare a inserire “by (Artist Name)” nei tuoi prompt se non l’hai già fatto. Tende a produrre risultati drammatici. Non aver paura di combinare artisti che normalmente non andrebbero insieme. Spesso Stable Diffusion combinerà i rispettivi stili in modi eccitanti e imprevedibili.

Consiglio: Se tu sei utilizzando la versione GUI di Stable Diffusion per Windows che abbiamo consigliato, c’è un pulsante “Roll” a destra della finestra del prompt che lancerà casualmente un artista sul tuo prompt. È un ottimo modo per imbattersi in nuovi stili.

Pesa le tue parole chiave Ovviamente, solo inserire parole chiave nel tuo prompt ti porterà solo lontano. Cosa succede se ottieni tutte le cose giuste nel tuo prompt, ma non sono adeguatamente proporzionate?

Stable Diffusion supporta la ponderazione delle parole chiave prompt. In altre parole, puoi dirgli che ha davvero bisogno di prestare attenzione a una parola chiave (o parole chiave) specifica e prestare meno attenzione ad altre. È utile se stai ottenendo risultati che corrispondono a ciò che stai cercando, ma non proprio lì.

RELAZIONATO: Come eseguire Stable Diffusion sul tuo PC per generare immagini AI

In la versione da riga di comando di Stable Diffusion, devi solo aggiungere due punti seguiti da un numero decimale alla parola che desideri enfatizzare. I numeri decimali sono percentuali, quindi la loro somma deve dare 1.

Tornando al nostro prompt “Gatto grigio carino”, immaginiamo che stia producendo correttamente gatti carini, ma non molte delle immagini di output mostravano gatti grigi. È possibile modificare il prompt in modo che legga: “carino, gatto grigio: 0,7”, e presterebbe la massima attenzione al gatto grigio, quindi applicherebbe automaticamente la differenza a “carino”. Puoi anche assegnare pesi a ciascuna parola nel prompt manualmente se desideri un controllo più preciso, ad esempio “Carino: 0,10, Gatto grigio: 0,60, Rendering di Unreal Engine: 0,30”.

RELAZIONATO: Come eseguire Stable Diffusion in locale con una GUI su Windows

La maggior parte della GUI disponibili per la diffusione stabile gestire la ponderazione senza richiedere l’inserimento di percentuali esplicite. Di solito puoi aggiungere parentesi attorno a un termine nel prompt per enfatizzarlo e parentesi per diminuire l’importanza di un termine. Quindi il precedente “gatto carino e grigio” potrebbe assomigliare a “[cute],((gatto grigio)).”

Nota: Puoi usare più parentesi per impilare l’enfasi quanto vuoi. Trova l’ispirazione altrove Stable Diffusion e altri generatori di arte IA hanno registrato un picco esplosivo di popolarità. Puoi trovare questo tipo di arte dell’IA ovunque. Ciò significa che ora ci sono almeno alcuni milioni di immagini generate dagli utenti che circolano su Internet e, la maggior parte delle volte, le persone includono il prompt che hanno utilizzato per ottenere i risultati.

RELAZIONATO: Questa galleria d’arte AI è ancora meglio dell’utilizzo di un generatore

Ecco alcune risorse per aiutarti a stimolare la tua ispirazione se non sei sicuro di cosa stai cercando di creare:

Avvertimento: Tutti questi sono potenzialmente NSFW. Lessico — un repository di immagini generate utilizzando Stable Diffusion e il prompt corrispondente. Ricercabile per parola chiave. Stable Diffusion Artist Style Studies — Un elenco non esaustivo di artisti che Stable Diffusion potrebbe riconoscere, oltre a descrizioni generali del loro stile artistico. Esiste un sistema di classificazione per descrivere quanto bene Stable Diffusion risponda al nome dell’artista come parte di un suggerimento. Studi sui modificatori di diffusione stabile – un elenco di modificatori che possono essere utilizzati con Stable Diffusion, proprio come la pagina dell’artista. L’elenco dei modificatori artistici AI — Una galleria fotografica che mostra alcuni dei modificatori più potenti che puoi utilizzare nei tuoi prompt e cosa fanno. Sono ordinati per tipo di modificatore. Top 500 Artisti Rappresentati in Diffusione Stabile — Sappiamo esattamente quali immagini sono state incluse nel training set di Stable Diffusion, quindi è possibile dire quali artisti hanno contribuito maggiormente all’addestramento dell’IA. In generale, più un artista era fortemente rappresentato nei dati di formazione, meglio Stable Diffusion risponderà al suo nome come parola chiave. La diffusione stabile Subreddit — Il subreddit di Stable Diffusion ha un flusso costante di nuovi suggerimenti e scoperte divertenti. Se stai cercando ispirazione o intuizione, non puoi sbagliare. Modifica altre impostazioni importanti Un buon prompt è la parte più difficile dell’utilizzo di Stable Diffusion, ma ci sono alcune altre impostazioni che cambieranno drasticamente i risultati.

CFG: Determina quanto fortemente Stable Diffusion segue il tuo prompt. Numeri più alti comportano una maggiore aderenza al prompt, mentre numeri più bassi danno all’IA più libertà. Prova a modificare prima questo. Metodo di campionamento: Come l’immagine viene raffinata dal rumore in forme riconoscibili. Prova alcuni di questi. Euler_a, k_LMS e PLMS sembrano essere scelte popolari. Passaggi di campionamento: Il numero di volte in cui un’immagine verrà campionata prima di ricevere un risultato finale. A volte ottieni buoni risultati a 30 passi, a volte devi andare a 50 o 80. Di solito non ottieni risultati migliori oltre i 150 passi. Inizia con meno gradini e sali. Alcuni dei nostri suggerimenti stilizzati preferiti Questi sono alcuni dei nostri suggerimenti preferiti poiché tendono a funzionare in modo così affidabile. Basta inserire un argomento di tua scelta più alcuni modificatori. Tutte le altre impostazioni di diffusione stabile sono state mantenute le stesse dei prompt sopra.

Nota: Di norma, la diffusione stabile crea eccezionalmente bene tramonti e foglie autunnali. (Soggetto), 35mm, nitido Scegli un soggetto e questo prompt restituisce in modo affidabile risultati fotorealistici di persone, animali e paesaggi.

Nota: Questo prompt di esempio includeva anche “Golden Hour” per ottenere i colori del tramonto. Prompt: fotografia del monte katahdin con un bellissimo lago, 35mm, nitido, ora d’oro (Soggetto), rendering 3d low poly, vivaci colori pastello, tilt shift, grana della pellicola Inserisci un argomento e lo otterrai nell’estetica “Art of Rally”.

(Soggetto), (Descrizione ambientale), cinematografico, drammatico, composizione, cielo soleggiato, brutalista, iperrealista, scala epica, senso di soggezione, ipermassimalista, livello di dettaglio folle, quartier generale della stazione artistica Basta inserire un soggetto e una descrizione ambientale e questo suggerimento fornisce fantastiche immagini di concept art della città con un effetto ambientale a tua scelta. Ecco un esempio che utilizza New York City come soggetto e tempesta di sabbia come descrizione ambientale:

suggerimento: New York City, tempesta di polvere, cinematico, drammatico, composizione, cielo soleggiato, brutalista, iperrealista, scala epica, senso di soggezione, ipermassimalista, folle livello di dettagli, quartier generale della stazione artistica Kermit Qualsiasi cosa La diffusione stabile produce ottimi risultati con Kermit. Provalo ovunque.

Perché è così che Stable Diffusion interpreta “Kermit in Mordor” e chi è la cosa rossa malvagia-Kermit in piedi dietro il nostro coraggioso eroe? Nessuna idea.

Ricorda, non aver paura di rimuovere quello che pensi possa essere un termine chiave dal tuo prompt. Alcune parole, come “splendido”, influenzeranno pesantemente l’aspetto di un’immagine, anche se non hanno un significato preciso. Man mano che trascorri più tempo con Stable Diffusion, svilupperai un’idea di come risponde a determinate parole e scoprirai rapidamente che scrivere un buon suggerimento è un’arte a sé stante.

Condividi questo articolo
Exit mobile version