2023年11月30日 星期四

(AI繪圖):stable diffusion從安裝到第一張圖

安裝

環境

  • 硬體:2.9 GHz * 16, 16G RAM, Nvidia顯示卡, 顯示卡6G RAM
  • 作業系統:fedora 37 (Linux)
  • 軟體:git, python, wget

步驟

開啟命令列,在你要安裝stable diffusion的目錄下執行以下指令:

wget -q https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh

然後執行抓下來的shell script,如以下指令:

chmod +x webui.sh

./webui.sh 

執行時還會再去網路上抓其他的檔案進行安裝,會花很長一段時間。另外/tmp空間如果不足,也會造成安裝失敗,

安裝完成後,要啟動stable diffusion,就是執行這個webui.sh,如:

./webui.sh

執行後會啟動一個listen 7860 port的web server,stable diffusion會自動用你的預設瀏覽器打開網頁,恭喜您,可以開始準備製作您的第一張AI圖片了。

文字生圖的設定:checkpoint

stable diffusion需要有checkpoint檔案,這是它運算所需要的神經網路模型,可以將其想像為一個大腦,由他來決定stable diffusion會把人物畫成擬真照片、還是Q版卡通、還是藝術油畫等等。您下的關鍵字它是否認識也決定了你的圖是否能成功畫出來,故這個檔案通常很大(2GB以上),這個檔案可以在網路上下載取得,例如知名的civitai。可以由該站的Models選取自己喜歡的風格,下載後放置到安裝目錄下的models/Stable-diffusion內,即可以在網頁介面中選取使用。

civitai網站的checkpoint下載頁面

文字生圖的設定:txt2img

stable diffusion的網頁介面如下圖:

最左上角的是選擇checkpoint的下拉式選單,若有下載checkpoint到剛剛所說的目錄,就可以在此處作選擇,這裏選的是偏向擬真類型的checkpoint

接下來的tab選單目前只要先知道第一個是txt2img(以文字產生圖片),還有第二個img2img(以圖片產生圖片)這兩種功能,以下介紹txt2img:

再來注意三個項目,一個是Prompt文字區塊、Negative Prompt文字區塊以及Generate按鈕,Prompt文字區塊就是把你想要畫的東西用英文表達出來,Negative Prompt文字區塊就是你絕對不希望在圖片裏看到的東西,就在此處用英文寫出,等於是Prompt的相反概念。都決定好了,就可以點下Generate按鈕讓AI製圖了!

下面的選項都是為了更精細圖片的進階選項,暫時先不作說明。這裏先簡單輸入:a boy running in the street到Prompt區作示範,依照電腦效能的不同,可能會在數十秒到幾分鐘不等的時間把圖產出,如下圖範例:

實際產出的圖片如下:

看來還蠻有模有樣的,我們已經踏出了成功的第一步囉。

 

沒有留言:

張貼留言