Puoi installa Stable Diffusion in locale sul tuo PC, ma il processo tipico comporta molto lavoro con la riga di comando da installare e utilizzare. Fortunatamente per noi, la comunità di Stable Diffusion ha risolto questo problema. Ecco come installare una versione di Stable Diffusion che gira in locale con un’interfaccia utente grafica!
Cos’è la diffusione stabile? Stable Diffusion è un modello AI in grado di generare immagini da prompt di testo o modificare immagini esistenti con un prompt di testo, proprio come A metà viaggio o DALL-E 2. È stato rilasciato per la prima volta nell’agosto 2022 da Stabilità.ai. Comprende migliaia di parole diverse e può essere utilizzato per creare quasi tutte le immagini che la tua immaginazione può evocare in quasi tutti gli stili.
Tuttavia, ci sono due differenze fondamentali che distinguono Stable Diffusion dalla maggior parte degli altri popolari generatori di arte AI:
Può essere eseguito localmente sul tuo PC È un progetto open source L’ultimo punto è davvero la questione importante qui. Tradizionalmente, Stable Diffusion viene installato ed eseguito tramite un’interfaccia a riga di comando. Funziona, ma può essere goffo, poco intuitivo ed è una barriera significativa all’ingresso per le persone che altrimenti sarebbero interessate. Ma, poiché si tratta di un progetto open source, la comunità ha rapidamente creato un’interfaccia utente per esso e ha iniziato ad aggiungere i propri miglioramenti, comprese le ottimizzazioni per ridurre al minimo la RAM video (VRAM) utilizzo e build in upscaling e mascheramento.
Di cosa hai bisogno per eseguire questa versione di Stable Diffusion? Questa versione di diffusione stabile è un fork – una propaggine – di il repository principale (repo) creato e gestito da Stability.ai. Ha un interfaccia utente grafica (GUI) – rendendolo più facile da usare rispetto alla normale diffusione stabile, che ha solo a interfaccia a riga di comando – e un programma di installazione che gestirà automaticamente la maggior parte della configurazione.
IMPARENTATO: Come eseguire Stable Diffusion sul tuo PC per generare immagini AI
Avvertimento: Come sempre, fai attenzione ai fork di software di terze parti che trovi su GitHub. Lo usiamo da un po’ di tempo senza problemi, così come migliaia di altri, quindi siamo propensi a dire che è sicuro. Fortunatamente, il codice e le modifiche qui sono piccole rispetto ad alcuni fork di progetti open source. Questo fork contiene anche varie ottimizzazioni che dovrebbero consentirne l’esecuzione su PC con meno RAM, upscaling integrato e funzionalità facciali utilizzando GFPGAN, ESRGAN, RealESRGAN e CodeFormer e mascheramento. Il mascheramento è un grosso problema: ti consente di applicare selettivamente la generazione di immagini AI a determinate parti dell’immagine senza distorcere altre parti, un processo tipicamente chiamato inpainting.
Un minimo di 10 gigabyte gratuiti sul tuo disco rigido Una GPU NVIDIA con 6 GB di RAM (anche se potresti essere in grado di far funzionare 4 GB) Un PC con Windows 11, Windows 10, Windows 8.1 o Windows 8 Il repository GitHub dell’interfaccia utente Webda AUTOMATIC1111 Pitone 3.10.6 (Anche le versioni più recenti e la maggior parte delle versioni precedenti dovrebbero andare bene) I Checkpoint Ufficiali della Diffusione Stabile (Fai attenzione ai checkpoint della v1.5!) Il GFPGAN versione 1.4 Punti di controllo Qualsiasi ulteriori modelli ESRGAN tu potresti volere. Puoi usarne quanti ne vuoi. Il processo di installazione è stato semplificato in modo significativo, ma ci sono ancora alcuni passaggi da eseguire manualmente prima di poter utilizzare il programma di installazione.
Installa Python prima La prima cosa che dovresti fare è installare la versione di Python, 3.10.6, consigliato dall’autore del repository. Vai a quel link, scorri verso la parte inferiore della pagina e fai clic su “Windows Installer (64 bit).”
Fare clic sull’eseguibile you scaricato e segui le istruzioni. Se hai già installato Python (e sicuramente lo fai), fai clic su “Aggiorna”. Altrimenti segui le istruzioni consigliate.
Nota: Assicurati di aggiungere Python 3.10.6 al PERCORSO se ottieni un’opzione per questo. Installa Git e scarica il repository GitHub Devi scarica e installa Git su Windows prima che il programma di installazione di Stable Diffusion possa essere eseguito. Basta scaricare il Eseguibile Git a 64 biteseguilo e utilizza le impostazioni consigliate a meno che tu non abbia in mente qualcosa di specifico.
IMPARENTATO: Come installare Git su Windows
Successivamente, è necessario scaricare i file dal repository GitHub. Fai clic sul pulsante verde “Codice”, quindi fai clic su “Scarica ZIP” nella parte inferiore del menu.
Apri il file ZIP in Esplora file o il tuo preferito programma di archiviazione file, quindi estrai il contenuto ovunque tu voglia. Tieni presente che la cartella è dove dovrai andare per eseguire Stable Diffusion. Questo esempio li ha estratti nella directory C:, ma non è essenziale.
Nota: Assicurati di non trascinare accidentalmente “stable-diffusion-webui-master” su un’altra cartella piuttosto che su uno spazio vuoto – se lo fai, cadrà in quella cartella, non nella cartella principale che intendevi. Scarica tutti i checkpoint Ci sono alcuni punti di controllo necessari affinché funzioni. I primi e più importanti sono i Checkpoint di diffusione stabile. Devi creare un account per scaricare i checkpoint, ma non è necessario molto per l’account: tutto ciò di cui hanno bisogno è un nome e un indirizzo e-mail e sei a posto.
Nota: Il download dei checkpoint è di diversi gigabyte. Non aspettarti che venga fatto all’istante.
Copia e incolla “sd-v1-4.ckpt” nella cartella “C:stable-diffusion-webui-mastermodelsStable-diffusion”, quindi fai clic con il pulsante destro del mouse su “sd-v1-4.ckpt” e premi rinomina . Digita “model.ckpt” nel campo di testo e premi Invio. Assicurati che sia “model.ckpt” – altrimenti non funzionerà.
Nota: La funzione di rinomina è un’icona su Windows 11.
Devi anche scaricare il Checkpoint GFPGAN. L’autore del repository che stiamo usando ha richiesto Punti di controllo GFPGAN v1.4. Scorri la pagina verso il basso, quindi fai clic su “Modello V1.4”.
Posiziona quel file, “GFPGANv1.4.pth”, nella cartella “stable-diffusion-webui-master”, ma fallo non rinominarlo. La cartella “stable-diffusion-webui-master” dovrebbe ora contenere questi file:
Puoi anche scarica tutti i checkpoint ESRGAN come vuoi. In genere vengono confezionati come file ZIP. Dopo averne scaricato uno, apri il file ZIP, quindi estrai il file “.pth” nella cartella “models/ESRGAN”. Ecco un esempio:
I modelli ESRGAN tendono a fornire funzionalità più specifiche, quindi scegline un paio che ti piaccia.
Ora devi solo fare doppio clic sul file “webui-user.bat”, che si trova nella cartella principale “stable-diffusion-webui-master”. Apparirà una finestra della console e inizierà a recuperare tutti gli altri file importanti, creando un ambiente Python e impostando un’interfaccia utente web. Sembrerà così:
Nota: Aspettatevi che la prima volta che lo eseguite richieda almeno qualche minuto. Ha bisogno di scaricare un sacco di cose da Internet. Se sembra bloccarsi per un tempo irragionevolmente lungo in un solo passaggio, prova a selezionare la finestra della console e a premere il tasto Invio.
Al termine, la console visualizzerà:
Running on local URL: http://127.0.0.1:7860 To create a public link, set `share=True` in `launch()` IMPARENTATO: Qual è l’indirizzo IP 127.0.0.1 e come lo si utilizza?
Come generare immagini utilizzando la diffusione stabile con una GUI Bene, hai installato la variante WebUI di Stable Diffusion e la tua console ti informa che è “in esecuzione su URL locale: http://127.0.0.1:7860”.
Nota: Cosa significa esattamente, cosa sta succedendo? 127.0.0.1 è l’indirizzo dell’host locale — l’indirizzo IP assegnato dal tuo computer. Questa versione di Stable Diffusion crea un server sul tuo PC locale accessibile tramite il proprio indirizzo IP, ma solo se ti connetti tramite il corretto porta: 7860. Apri il browser, inserisci “127.0.0.1:7860” o “localhost:7860” nella barra degli indirizzi e premi Invio. Vedrai questo nella scheda txt2img:
Se hai già utilizzato Stable Diffusion, queste impostazioni ti saranno familiari, ma ecco una breve panoramica del significato delle opzioni più importanti:
Richiesta: La descrizione di ciò che desideri creare. Pulsante tavolozza del pittore: Applica uno stile artistico casuale al prompt. Passaggi di campionamento: Il numero di volte in cui l’immagine verrà rifinita prima di ricevere un output. Di più è generalmente meglio, ma ci sono rendimenti decrescenti. Metodo di campionamento: La matematica sottostante che governa il modo in cui viene gestito il campionamento. Puoi usare uno qualsiasi di questi, ma euler_a e PLMS sembrano essere le opzioni più popolari. Puoi leggere di più su PLMS in questo documento. Ripristina volti: Utilizza GFPGAN per cercare di correggere volti inquietanti o distorti. Conteggio batch: Il numero di immagini da generare. Dimensione del lotto: Il numero di “lotti”. Tienilo a 1 a meno che tu non abbia un’enorme quantità di VRAM. Scala CFG: Con quanta attenzione Stable Diffusion seguirà il suggerimento che gli dai. Numeri più grandi significano che lo segue con molta attenzione, mentre numeri più bassi gli danno più libertà creativa. Larghezza: La larghezza dell’immagine che vuoi generare. Altezza: La larghezza dell’immagine che vuoi generare. Seme: Il numero che fornisce un input iniziale per un generatore di numeri casuali. Lascialo a -1 per generare casualmente un nuovo seme. Generiamo cinque immagini in base al prompt: “una mucca dell’altopiano in una foresta magica, fotografia su pellicola da 35 mm, nitida” e vediamo cosa otteniamo utilizzando il campionatore PLMS, 50 passaggi di campionamento e una scala CFG di 5.
Mancia: Puoi sempre premere il pulsante “Interrompi” per interrompere la generazione se il tuo lavoro richiede troppo tempo. La finestra di output sarà simile a questa:
Nota: Le tue immagini saranno diverse. L’immagine in alto al centro è quella che useremo per provare a mascherare un po’ più tardi. Non c’è davvero una ragione per questa scelta specifica oltre alle preferenze personali. Prendi qualsiasi immagine che ti piace.
Selezionalo, quindi fai clic su “Invia a Inpaint”.
Come mascherare le immagini che crei per Inpaint Inpainting è una caratteristica fantastica. Normalmente Stable Diffusion viene utilizzato per creare intere immagini da un prompt, ma l’inpainting consente di generare (o rigenerare) selettivamente parti dell’immagine. Ci sono due opzioni critiche qui: inpaint mascherato, inpaint non mascherato.
Inpaint mascherato utilizzerà il prompt per generare immagini all’interno dell’area evidenziata, mentre inpaint non mascherato farà esattamente l’opposto: verrà preservata solo l’area mascherata.
Parleremo prima di Inpaint mascherato. Trascina il mouse sull’immagine tenendo premuto il tasto sinistro e noterai uno strato bianco che appare sopra l’immagine. Disegna la forma dell’area che desideri sostituire e assicurati di riempirla interamente. Non stai circondando una regione, stai mascherando l’intera regione.
Mancia: Se stai solo aggiungendo qualcosa a a In un’immagine esistente, può essere utile provare ad allineare la regione mascherata con la forma approssimativa che si sta tentando di creare. Mascherare una forma triangolare quando si desidera un cerchio, ad esempio, è controproducente. Prendiamo l’esempio della nostra mucca delle Highlands e diamogli un cappello da chef. Nascondi una regione approssimativamente a forma di cappello da chef e assicurati di impostare “Dimensione batch” su più di 1. Probabilmente ne avrai bisogno di più per ottenere un risultato ideale (più o meno).
Inoltre, dovresti selezionare “Latent Noise” anziché “Fill”, “Original” o “Latent Nothing”. Tende a produrre i migliori risultati quando si desidera generare un oggetto completamente nuovo in una scena.
Nota: Noterai che il bordo sinistro del cappello ha cancellato parte del suo corno. Ciò è accaduto perché l’impostazione “Mask Blur” era un po’ troppo alta. Se vedi cose del genere nelle tue immagini, prova a diminuire il valore “Maschera sfocatura”. Prompt: Cappello da cuoco Impostazioni: Inpaint Masked, Latent Diffusion, CFG 9.5, denoise strength 0.75, Sampling Steps = 50, Sampling Method = Euler_A Va bene, forse un cappello da chef non è la scelta giusta per la tua mucca dell’altopiano. La tua mucca delle Highland è più interessata alle vibrazioni dei primi del 20° secolo, quindi diamogli una bombetta.
Prompt: Bowel hat Impostazioni: Inpaint Masked, Latent Diffusion, CFG 9.5, denoise strength 0.75, Sampling Steps = 50, Sampling Method = Euler_A Come positivamente azzimato.
Naturalmente, puoi anche fare l’esatto contrario con Inpaint Not Masked. È concettualmente simile, tranne per il fatto che le regioni definite sono invertite. Invece di contrassegnare la regione che si desidera modificare, si contrassegnano le regioni che si desidera preservare. Spesso è utile quando vuoi spostare un piccolo oggetto su uno sfondo diverso.
Come correggere l’errore “CUDA Out Of Memory”. Più grande è l’immagine creata, maggiore è la memoria video richiesta. La prima cosa che dovresti provare è generare immagini più piccole. Stable Diffusion produce buone immagini, anche se molto diverse, a 256×256.
Se hai voglia di creare immagini più grandi su un computer che non ha problemi con le immagini 512×512, o stai riscontrando vari errori di “Memoria esaurita”, ci sono alcune modifiche alla configurazione che dovrebbero aiutarti.
Apri “webui-user.bat” in Blocco noteo qualsiasi altro editor di testo semplice che desideri. Basta fare clic con il pulsante destro del mouse su “webui-user.bat”, fare clic su “Modifica”, quindi selezionare Blocco note. Identificare la riga che legge set COMMANDLINE_ARGS=. È qui che posizionerai i comandi per ottimizzare il funzionamento di Stable Diffusion.
IMPARENTATO: Come scrivere uno script batch su Windows
Se vuoi solo realizzare immagini enormi o stai esaurendo la RAM su una GPU della serie GTX 10XX, prova –opt-split-attention primo. Sembrerà così:
Quindi fare clic su File > Salva. In alternativa, puoi premere Ctrl+S sulla tastiera.
Se ricevi ancora errori di memoria, prova ad aggiungere –medvram all’elenco degli argomenti della riga di comando (COMMANDLINE_ARGS).
Puoi aggiungere –always-batch-cond-uncond per provare a risolvere ulteriori problemi di memoria se i comandi precedenti non hanno aiutato. C’è anche un’alternativa a –medvram che potrebbe ridurre ulteriormente l’utilizzo della VRAM, –lowvramma non possiamo attestare se funzionerà o meno.
L’aggiunta di un’interfaccia utente è un passo avanti fondamentale per rendere accessibili a tutti questi tipi di strumenti basati sull’intelligenza artificiale. Le possibilità sono quasi infinite, e anche una rapida occhiata al comunità online dedicate all’arte AI ti mostrerà quanto sia potente la tecnologia, anche quando è agli inizi. Ovviamente, se non hai un computer da gioco o non vuoi preoccuparti della configurazione, puoi sempre usare uno dei generatori di arte AI online. Tieni presente che non puoi presumere che le tue voci siano private.