YSL: (AI繪圖)：stable diffusion的繪圖技巧

2023年12月10日星期日

一般而言，就以一個英文句子來描述圖片的長相，例如：

a cat dressed as a king on the throne

而通常描述一個畫面很難一句話說明完所有細節，所以針對每樣特徵，可以用逗號分隔的方式來描述每一樣細節，例如：

a witch, broom, hat, laughing, in snowy forest, at dark night

似乎不是深夜？是的，AI不是每次都會完全聽提示語的方式運作，一般的情形是一次產生好幾張圖再由其中挑選最為符合的，可以由下面選單中的Batch count來選擇一次要產生多少張圖片，當然，所需的時間也會倍數成長。

除了人物圖片也可以製作風景圖片，例如：

an ancient european village, in a valley, scenery

描述天氣可以讓環境有額外的效果，例如：

a big japanese city, heavy traffic, rainy day

但這些效果其實也與使用的checkpoint有關連，有的checkpoint以美女圖為主，那怎麼樣也畫不出老奶奶。有checkpoint以東亞人為基礎，那怎麼樣都無法畫出黑人的。

除了描述圖片之外，有一些輔助的字可以提昇圖片的質感與控制圖片的內容，例如你想要做出魚眼鏡頭效果，可以加上fisheye view指令：

a strong man, fisheye view, lifting up a dump bell, at gym

cinematic可以讓出來的圖片有如電影劇照的質感，以下兩張圖片可以比較其差異：

（右邊的有加上cinematic關鍵字）

an elegant lady, straw hat, drinking coffee at outdoor cafe, sunny day, cinematic

a worker in khakis, in machinery factory, steam, dust, low angle

當然也可以使用很熱門的cyberpunk、gothic、zombie apocalypse等等與風格有關的關鍵字，可以做出許多有趣的效果，像是：

inside an ancient european palace, gothic, dark, a glum baron, close-up

但要注意，提示語裡面的關鍵字對圖片每個部份都有影響，如果你有指定頭髮顏色、但衣服的顏色沒有指定，那麼很大機會衣服的顏色會跟你頭髮的顏色有關。

有沒有想過很多人出現的場合怎麼顯示呢，例如這樣：

a cheerleader surrounded by students, laughing, at baseball court

但由於剛剛提到的，所有提示語都會對全域產生影響，所以如果要描述個別人或事物是作不到的，會產生提示語互相污染的情形，例如：

a girl, yellow blouse, brown leggings, a boy, leather jacket, navyblue jeans, walking along the pavement, look at viewer

衣服上的配置好像不太對？如果針對單一個人的描述可以縮短到一句話內，不要分成好幾個逗點或許會有幫助，但是終究還是需要有更明確的分隔方法才能好好描述多個不同個體，這時候Latent Couple就可以幫上忙了。

YSL