2023年12月10日 星期日

(AI繪圖):stable diffusion的繪圖技巧

一般提示語撰寫

一般而言,就以一個英文句子來描述圖片的長相,例如:

a cat dressed as a king on the throne

而通常描述一個畫面很難一句話說明完所有細節,所以針對每樣特徵,可以用逗號分隔的方式來描述每一樣細節,例如:

 

a witch, broom, hat, laughing, in snowy forest, at dark night

似乎不是深夜?是的,AI不是每次都會完全聽提示語的方式運作,一般的情形是一次產生好幾張圖再由其中挑選最為符合的,可以由下面選單中的Batch count來選擇一次要產生多少張圖片,當然,所需的時間也會倍數成長。

除了人物圖片也可以製作風景圖片,例如:

an ancient european village, in a valley, scenery

描述天氣可以讓環境有額外的效果,例如:

a big japanese city, heavy traffic, rainy day

但這些效果其實也與使用的checkpoint有關連,有的checkpoint以美女圖為主,那怎麼樣也畫不出老奶奶。有checkpoint以東亞人為基礎,那怎麼樣都無法畫出黑人的。

除了描述圖片之外,有一些輔助的字可以提昇圖片的質感與控制圖片的內容,例如你想要做出魚眼鏡頭效果,可以加上fisheye view指令:

 a strong man, fisheye view, lifting up a dump bell, at gym

cinematic可以讓出來的圖片有如電影劇照的質感,以下兩張圖片可以比較其差異:

(右邊的有加上cinematic關鍵字)

an elegant lady, straw hat, drinking coffee at outdoor cafe, sunny day, cinematic

 a worker in khakis, in machinery factory, steam, dust, low angle

當然也可以使用很熱門的cyberpunk、gothic、zombie apocalypse等等與風格有關的關鍵字,可以做出許多有趣的效果,像是:

 
inside an ancient european palace, gothic, dark, a glum baron, close-up

但要注意,提示語裡面的關鍵字對圖片每個部份都有影響,如果你有指定頭髮顏色、但衣服的顏色沒有指定,那麼很大機會衣服的顏色會跟你頭髮的顏色有關。

有沒有想過很多人出現的場合怎麼顯示呢,例如這樣:

a cheerleader surrounded by students, laughing, at baseball court

但由於剛剛提到的,所有提示語都會對全域產生影響,所以如果要描述個別人或事物是作不到的,會產生提示語互相污染的情形,例如:

a girl, yellow blouse, brown leggings, a boy, leather jacket, navyblue jeans, walking along the pavement, look at viewer

衣服上的配置好像不太對?如果針對單一個人的描述可以縮短到一句話內,不要分成好幾個逗點或許會有幫助,但是終究還是需要有更明確的分隔方法才能好好描述多個不同個體,這時候Latent Couple就可以幫上忙了。

沒有留言:

張貼留言