劃掉妳做過的圖片素材——如何還原塗鴉照片

妳做了什麽，把照片劃掉了？在載文之前，簡單說兩句:

AI畫圖在22年剛出來的時候被關註和嘗試了壹段時間，很快就被拋棄了。沒有他，賣家的秀和買家的秀差別太大。看著自己生成的垃圾圖，和別人生成的精美畫作對比，真的是壹種說服。直到最近ControlNet刷了壹波屏，覺得離可用的制作工具又近了壹步，才被重新研究。事實證明，短短幾個月，整個AI畫的進度速度真的讓我背脊發涼。大家都在瘋狂的用AI做地圖，玩新工具(Controlnet)，玩插件(LORA，Dreambooth，Hypernetwork)，玩模型(ChilloutMixdddd)，但是關於嗶哩嗶哩和知乎使用StableDiffusion卻沒有系統的介紹，這讓我壹時有點迷茫。

這篇新手教學文章引用自

本網站強烈建議初學者閱讀本網站下的每壹篇文章。可以說涵蓋了StableDiffusion最高級使用的方方面面，讓妳以最快的速度了解最新的機型、插件、原理、技術和使用方式。

提示是AI畫圖中最重要的輸入控制項，也就是有很多定制的模型可以讓妳更直接更簡單的生成特定風格的圖像。妳仍然需要寫壹個好的提示來獲得壹個值得展示的圖像。我相信大部分中國用戶和我壹樣，大概都是英文讀3星寫0星的玩家。看別人改別人的提示也可以。如果是自己寫的，除了veryverybeautiful__，妳就想不出別的詞了。這篇基礎教學文章通過對關鍵詞進行分類，讓妳更清楚地知道應該使用或查詢哪些詞來構建妳需要的圖像。此外，本文還介紹了關鍵詞加權、混合等非常實用的技巧，以及SD如何理解妳的輸入詞匯等基礎知識。相信無論妳是想修改提示還是自己從頭開始寫，無論妳是新手還是老手，即使妳已經開始使用chatGPT輔助生成提示，這篇文章還是非常值得壹讀的。

本文原文鏈接為

以下為文字翻譯，請勿轉載:

StableDiffusionprompt:adedefinitiveguide

知道如何構造壹個優秀的提示，是每個SD用戶首先要學習的。本文通過總結實驗和以往的經驗，給出了構造指令的方法和相關技巧。總之，在這篇文章中妳會學到所有關於提示的信息。

什麽是優秀的提示指令？

壹份優秀的提示說明書應該詳細而具體。壹個好方法是在關鍵詞分組列表中找到壹個符合妳需求的詞。

關鍵詞分組如下:

1.科目

2.繪畫媒介

3.繪畫風格

4.藝術家姓名

5.網站(全球資訊網的主機站)

6.解決

7.詳細描述(附加詳細信息)

8.顏色

9.照明設備

在實際編寫的壹組提示指令中，沒有必要包含上述各組中的所有關鍵字。妳只需要把這個分組列表當成壹個提示列表，知道在添加新的提示時如何選擇。

接下來，我們將對這些組中的關鍵字逐壹進行測試，下面的測試將使用默認模型sdv1.5basemodel。為了明確每個關鍵字的功能，測試中不會使用negativeprompts。但是不要擔心，我們將在文章的後面學習如何使用否定提示指令。下面的圖片都是用30步，DP M++2mkarasampler，512x704分辨率參數生成的。翻譯註意:後續翻譯文章中使用的圖片並非原文中的圖片，而是譯者本人使用Colab上的基本模型轉載的，以防作者亂說。其中CFG為7，batch count = 8，Seed使用隨機設置-1，選中Restoreface，通常會生成三次或更多次來選擇可用的示例圖。另外，與作者不同的是，我增加了“截，裸”的負面指令，以提高提款率，規避審核風險。

科目

主體代表妳在圖片中看到的實體。寫說明書的時候，最常見的錯誤就是缺少足夠的實體關鍵詞。

例如，我現在想生成壹張asorceresscastingmagic的圖片。壹個新的SD播放器可能會寫這個

女記者

這樣寫是可以的，但是留下的想象空間太大了。這個女巫長什麽樣？能有什麽詞形容她能讓她看起來更清晰嗎？她穿的是什麽？她釋放了什麽魔法？她是站著、跑著還是飄在空中？圖像的背景是什麽？

StableDiffusion無法讀取我們的想法，我們必須說出我們需要的所有細節。

對於人物來說，壹個常見的技巧就是使用明星的名字，因為這些單詞會對輸出結果產生很強的作用，也是控制輸出主體外觀的壹個非常好的方法。但需要註意的是，使用這些名稱不僅會導致輸出結果的面貌發生變化，還會導致輸出同質的姿勢、風格等物體。這壹點會在文章後面的“關聯效應”章節詳細介紹。

舉個例子，我們先把這個女巫做成EmmaWatson的樣子，Emma Watson也是SD中使用最廣泛的關鍵詞。我們希望這個女巫充滿力量和神秘，使用閃電魔法。她的造型充滿了細節。看看能不能生成壹些有趣的圖片。

EmmaWatsonasapowerfulmysterioussorceress，鑄造發光魔術，細節服裝

EmmaWatson在模型中是如此的常見和有效。我覺得SD用戶這麽喜歡用她的名字，是因為她看起來很優雅，很年輕，同時她在目前互聯網上的大部分圖片中的形象也是壹致的。相信我，不是所有的女演員都這樣，尤其是活躍在90年代甚至更早的女演員。

繪畫介質(中等)

媒體代表用來制作繪畫的材料。舉壹些例子比如插畫，油畫)，3d渲染，攝影。媒體關鍵詞對輸出結果也有很強的影響，壹個相關詞匯的修改會改變整個輸出結果的風格。

再加壹個相關的關鍵詞，digitalpainting。

EmmaWatsonasapowerfulmysterioussorceress，鑄造發光魔法，細節服裝，數碼繪畫

輸出結果變成了我們想要的風格！圖片從照片變成了數碼畫。

繪畫風格

風格代表壹種繪畫藝術風格，如印象派、超現實主義、波普藝術等。

讓我們試著在說明中添加壹些風格關鍵詞:超現實主義、幻想、超現實主義、全身。

EmmaWatsonasapowerfulmysterioussorceress，鑄造發光魔法，細節服裝，數碼繪畫，超現實主義，幻想，超現實主義，全身

嗯（表示躊躇等）...很難說這些詞對結果的影響有多大，也許是因為這些風格關鍵詞已經被前面的關鍵詞暗示了。但是看起來留住他們是沒有問題的。

藝術家(藝術家)

藝人名字也是影響權重很高的關鍵詞。通過指定藝術家的姓名，您可以使您的輸出與其特定的藝術風格相匹配。此外，許多藝術家的名字通常被用來獲得壹個混合的藝術風格。接下來，我們將添加兩個藝術家關鍵詞:超級英雄漫畫家StanleyArtgermLau和19世紀的肖像畫家AlphonseMucha。

EmmaWatsonasapowerfulmysterioussorceress，castinglightningmagic，細節服裝，數碼繪畫，超現實主義，幻想，超現實主義，全身，by Stanley artgermlauandalphonsemucha

我們可以看到，這兩位藝術家的繪畫風格結合起來，效果非常好。夏目是壹位非常著名的畫家。在我非專業的認知裏，他可以算是塔羅牌畫風的創始人。他的畫有壹種突出的古典、巴洛克和圖形風格，這是另壹位畫家所不熟悉的。在生成的示例圖中，您可以看到木下的風格非常引人註目。這裏我在做樣圖的時候把閃電的英文單詞拼錯了，所以大家可以看到生成的圖中基本沒有閃電，但是因為木下+艾瑪真的很好聽，我就不改了。

網站名稱(網站)

像Artstation、DeviantArt這樣的圖片收集網站，已經聚集了大量流派明確的圖片。加入這樣的關鍵詞可以讓我們的輸出結果收斂到網站上圖片的藝術風格。

EmmaWatsonasapowerfulmysterioussorceress，castinglightningmagic，細節服裝，數碼繪畫，超現實主義，幻想，超現實主義，全身，by Stanley artgermlauandalphonsemucha，artstation

看起來變化不大，但生成的圖片確實像妳在Artstation上能找到的那張。翻譯註:我不確定作者所說的網站是重刻過程中有效的關鍵詞類別。當我在webui中輸入artstation時，token的數量從43變成了45，我非常懷疑模型把它拆分成兩個字:art和station作為輸入(原因見文章後面“指令可以有多長”壹章)。另外，網站本身風格多樣，我不太明白會對輸出結果有什麽影響。我會在下面的例子中刪除這個關鍵詞，防止造成不好的影響。至於和上壹節相比的閃電，那只是因為我把閃電的拼寫糾正正確了。

分辨率(分辨率)

銳度表示輸出圖像的銳度和細節。我們試著加上這兩個關鍵詞:highlydetailed，sharpfocus。

EmmaWatsonasapowerfulmysterioussorceress，castinglightningmagic，細節服裝，數字繪畫，超現實主義，幻想，超現實主義，全身，bystanley artgermlauandalphonsemucha，artstation，highlydetailed，sharpfocus

嗯，好像沒多大作用。應該是之前的圖經過了銳化和細化，不過加進去也沒什麽壞處。

附加詳細信息(附加詳細信息)

細節描述是調整畫面的調味。我們嘗試加入sci-fi(科幻)、stunninglybeautiful(美麗)和反烏托邦(反烏托邦)，對形象做壹些調整。

顏色(彩色)

通過添加顏色關鍵字，您可以控制圖像的整體顏色。您添加的顏色可以用作整個圖像的色調或某個對象的顏色。

我們試圖通過使用關鍵字虹彩黃金給圖像添加壹點金色。

EmmaWatsonasapowerfulmysterioussorceress，castinglightningmagic，細節服裝，數字繪畫，超現實主義，幻想，超現實主義，全身，bystanley artgermalauandalphonsemucha，artstation，highlydetailed，sharpfocus，科幻，絕美，反烏托邦，彩虹色

黃金效果非常好！

照明(照明)

所有攝影師都會告訴妳，壹部電影的要素之壹就是燈光。光照關鍵詞對生成的圖片也有很大的影響。讓我們試著在說明書中加入電影燈光和黑暗。

EmmaWatsonasapowerfulmysterioussorceress、castinglightningmagic、細節服裝、數字繪畫、超現實主義、幻想、超現實主義、全身、bystanley artgermlauandalphonsemucha、artstation、highlydetailed、sharpfocus、科幻、美輪美奐、反烏托邦、彩虹色、電影燈光、黑暗

以上，我們已經完成了整個演示的提示指令的構建。

摘要

也許妳已經註意到，僅僅在基本的目標對象上添加幾個關鍵詞，就已經可以生成壹個好的圖像了。構建StableDiffusion的輸入指令通常不需要添加太多的關鍵字。

否定提示

負面提示指令是另壹個非常有效的調整圖像的輸入。妳可以通過輸入妳不想要的而不是妳想要的來調整圖像。負面提示指令不僅可以排除實物，還可以是風格或其他不想要的圖像特征(如醜陋、變形)。

如果妳用的是二代模型版SD(註:目前大部分人用的是壹代模型版1.4/1.5)，那麽負提示指令是必選項，否則妳得到的圖像會比壹代模型版差很多。對於第壹代版本，負命令是可選的，但實際使用時會設置。畢竟，即使負命令沒有提高圖像的效果，也不會對其造成任何傷害。

我將使用壹般的否定提示指令。您可以在本文中了解更多關於它的原理和更詳細的用法。

醜陋、平鋪、手下垂、腳下垂、臉下垂、臉歪、臉歪、四肢外、毀容、變形、身體歪、人體解剖、水印、簽名、截止、低對比度、曝光不足、曝光過度、臉歪、初學者、業余、臉歪、模糊、草稿、粒狀

可以看出，否定提示指令使圖像中的主體更加突出，不會顯得過於平淡。

構建良好指令的過程

叠代構造

您應該使用叠代過程來構建提示指令。正如前面的例子所展示的，隨著關鍵字壹個接壹個地添加到正文中，我們最終可以生成很棒的圖片。

我總是從簡單的說明開始，只包含主題、媒介和風格等關鍵詞。生成至少4張圖片來觀察結果。這些基本指令大部分在100%的情況下無效。妳需要對妳使用的基本關鍵詞有壹些統計上的認識。

在叠代過程中，壹次最多添加2個關鍵詞，也至少生成4張圖來觀察效果。

使用否定提示命令

使用壹般的否定提示指令總是壹個可靠的開始。

否定提示指令加關鍵詞也是叠代造句的壹部分。這些負面關鍵詞可以是妳想在圖像中避免出現的物體或身體部位。(由於第壹代機型不太擅長渲染手部，所以通過在負指令中加入關鍵字“手”直接隱藏在圖像中也是不錯的選擇。)

提示說明書寫作技巧

您可以調整關鍵字的影響因子，也可以控制在特定采樣步驟後切換關鍵字。

自動111 GUI翻譯可以使用以下語法註意:是stable-difference-webui。您可以在Colabnotebook上使用該工具，或者將其部署到您的本地Windows或Mac計算機上。

關鍵詞權重

(這個語法可以用在webui中。)

妳可以用語法`( keyword: weight)`來控制關鍵詞的影響因素。權重是壹個數值，小於1表示重要性低，大於1表示重要性高。

例如，我們可以在下面的指令中為關鍵字dog增加權重。

狗，秋天巴黎，華麗，美麗，大氣，共鳴，霧，煙，火，煙囪，雨，潮濕，原始，水坑，融化，滴水，雪，小溪，郁郁蔥蔥，冰，橋，森林，玫瑰，花，bystanleyartgermlau，gregrutkowski，thomaskindkade，alphonsemucha，loish，normanrockwell。

增加狗的重量會導致更多的狗出現在圖像中，反之亦然。並非所有的圖像權重都有這樣的效果，但在大多數情況下，您可以預期權重會有這樣的效果。

這種技術不僅可以用於主要關鍵字，還可以用於所有關鍵字類別，如風格或照明。

()和[]語法

(這個語法可以用在webui中。)

()和[]是相當於調整關鍵詞權重的語法。(關鍵詞)'會將括號中的關鍵詞權重增加1.1倍，相當於'(關鍵詞:1.1)'。【關鍵詞】“將括號中的關鍵詞權重降低到0.9倍，相當於“(關鍵詞:0.9)”。

妳可以像代數公式壹樣使用多個括號來倍增權重效果。

(關鍵字):1.1

((關鍵字)):1.21

(((關鍵字))):1.33

同樣，使用多個括號的效果如下:

【關鍵詞】:0.9

[[關鍵詞]]:0.81

[[[關鍵字]]]:0.73

關鍵詞混合

(這個語法可以用在webui中。)

妳可以混合使用兩個關鍵詞，這就是所謂的promptscheduling。語法如下:

[關鍵詞1:關鍵詞2:影響因子]

“影響因子”控制哪壹步采樣提示指令中的關鍵字1將切換到關鍵字2，關鍵字2是壹個介於0和1之間的參數。

例如，使用以下說明

油畫肖像[JoeBiden:DonaldTrump:0.5]

將輸入的步長參數設置為30。

這意味著在生成過程的前15個步驟中使用以下指令。

油畫肖像

在步驟16到30的下壹個生成過程中，指令將變成如下。

油畫肖像

影響因素參數將決定關鍵詞何時改變。在上面的例子中，它將在30步x 0.5 = 15步之後執行。

調整影響因子的效果可以看做是不同程度地混合了兩位總統的肖像。

妳可能註意到了，川普穿白色西裝，更喜歡拜登的服裝搭配，這其實說明了關鍵詞混搭中壹個很重要的規律:關鍵詞1決定了整體的混搭效果。擴散的生成步驟越早，對圖像整體混合結果的影響越大，而後期的生成步驟只負責逐漸改善細節。

小測驗:如果把上面例子中的JoeBiden和DonaldTrump反過來，妳覺得生成的圖片會怎麽樣？

面部融合

關鍵字混合常用於借用兩個不同的明星來創建壹個新的面孔。例如，[艾瑪·沃特森:琥珀聽說:0.85]，40步，會產生壹張介於之間的臉:

[Emma Watson:amber heard:0.85]油畫，背景模糊，優雅

選擇兩個合適的名字，調整參數，就可以得到我們想要的外觀。

破產版本提示對提示

利用關鍵字混合，可以得到類似於prompt-to-prompt的效果，即通過編輯生成壹對高度相似的圖像。以下兩幅圖使用了相同的提示指令，只是使用了命令調度語法將蘋果替換為火焰，兩幅圖的種子和步驟的參數設置也是相同的。註:此處使用的示例圖片為本人制作，與原文不符。提示指令改成用火球代替蘋果，主要是因為火焰不是很有效。

【Emma Watson:amber heard:0.75】holding an【蘋果:火球:0.9】，shiningbokehdepthoffieldbackground背景，經典，油畫，人像，優雅，upperclass，紅唇，耳掛。步驟:40，采樣器:DPM++2MKarras，CFGscale:6，種子:805277495

混合因子需要微調。具體是怎麽操作的？其背後的理論是，輸出圖像的整體效果是由早期的擴散過程決定的。當擴散過程開始集中在更小的區域時，切換任何關鍵詞都不會對圖像的整體結果產生很大的影響。這使得以這種方式僅改變圖像的壹小部分成為可能。

指令可以有多長？

指令長度取決於您使用的StableDiffusion應用程序，該應用程序可能會限制提示中的關鍵字數量。在SD生成的基本版本中，指令被限制為75個令牌。

應該註意的是，記號不同於單詞。SD使用的CLIP模型會自動將提示指令轉換成壹組單詞，即模型已知單詞的數字表示。如果使用模型不知道的單詞或短語，該單詞將被分成兩部分。