<p class="ql-block ql-indent-1">大家在自行嘗試使用SD作圖的時(shí)候可能遇到了這樣的情況——同樣只寫了“1girl(一個(gè)女孩)”作為提示詞,葫蘆叔教程里演示的圖片是這樣的:</p> <p class="ql-block ql-indent-1">可有的小伙伴自己折騰半天生出來的圖片卻是這樣?jì)鸬模ó?dāng)同事拿著他生的這些圖來質(zhì)問我的時(shí)候請(qǐng)?jiān)徫覠o情的笑出了豬叫):</p> <p class="ql-block ql-indent-1"><span style="color:rgb(1, 1, 1);">ok,請(qǐng)先把手里的臭雞蛋放下,出現(xiàn)這種情況并不是因?yàn)楹J叔忽悠了各位,而是因?yàn)?lt;/span><span style="color:rgb(237, 35, 8);">你沒有設(shè)置出圖所需的模型</span><span style="color:rgb(1, 1, 1);">。</span></p><p class="ql-block ql-indent-1"><span style="color:rgb(1, 1, 1);">關(guān)注AIGC領(lǐng)域或者看過我其他文章的朋友,應(yīng)該都知道AI繪圖工具能夠生成的圖像風(fēng)格其實(shí)是多種多樣的:</span></p> <p class="ql-block ql-indent-1">輸入提示詞固然可以直接影響最終的成像效果,但想要實(shí)現(xiàn)風(fēng)格差異如此巨大的創(chuàng)作,只靠寫提示詞是不夠的。準(zhǔn)確的說,提示詞在整個(gè)AI成像過程中起到的只不過是傳令兵的作用,而它所調(diào)用的力量,就來自于模型。</p><p class="ql-block ql-indent-1">注意,這里所說的模型,并非是指Stable Diffusion本體這樣的大模型。如果把SD比作一個(gè)人的話,大模型相當(dāng)于它的身體構(gòu)造和生理機(jī)能,<span style="color:rgb(1, 1, 1);">而本章所述的模型,</span><span style="color:rgb(237, 35, 8);">則可以看做SD認(rèn)識(shí)我們這個(gè)世界所使用的素材合集,也就是訓(xùn)練集。</span></p> <p class="ql-block ql-indent-1">當(dāng)我們把一本語文書擺在一個(gè)小學(xué)生面前,他就會(huì)明白接下來要面對(duì)的任務(wù)大概是識(shí)字填詞造句作文之類;換成數(shù)學(xué)書,則是加減乘除邏輯運(yùn)算相關(guān)。同理,當(dāng)我們?yōu)镾D選擇訓(xùn)練集(也就是選擇模型)以后,它也會(huì)認(rèn)清自己接下來要生成的是一幅照片級(jí)仿真圖像,還是二次元卡通形象。</p> <p class="ql-block ql-indent-1">在Stable Diffusion中,目前最常見的模型主要有三類,其中最重要的,就是Checkpoint(檢查點(diǎn))模型,通常也被稱為底模,是SD出圖必不可少的基本模型,其自身的訓(xùn)練集屬性也會(huì)對(duì)我們的成像風(fēng)格產(chǎn)生最直接的影響。</p> <p class="ql-block ql-indent-1">例如葫蘆叔之前推薦的<a href="http://www.h-ceramic.com.cn/4tixqjz5" target="_blank" style="font-size:18px; background-color:rgb(255, 255, 255);">頂級(jí)亞洲人物模型brav5</a>,就是一個(gè)非常典型的真實(shí)系模型,由于這個(gè)模型在煉制過程中使用了海量的真人照片作為訓(xùn)練素材,所以使用它生成的幾乎全是令人難辨真假的仿真人物圖像;相反的,由于其訓(xùn)練集中缺少動(dòng)漫風(fēng)格的圖片素材,所以即使加入animated、comic等提示詞,也很難讓它生成理想的二次元風(fēng)格圖像。</p> <p class="ql-block ql-indent-1">Checkpoint模型的訓(xùn)練對(duì)設(shè)備和素材集的要求都比較高,通常單個(gè)模型的大小在1Gb-10Gb之間,后綴名為.ckpt或.safetensors,存放路徑為SD安裝目錄下的models\stable diffusion文件夾,將下載的模型文件放入該目錄后刷新模型列表,即可在webUI中選擇并使用。</p> <p class="ql-block ql-indent-1">當(dāng)然如果你用的是哩布哩布AI或吐司之類的云端SD,那就不需要下載,直接選擇需要的模型在線加載就可以了。</p> <p class="ql-block ql-indent-1">相對(duì)于MJ這類僅由官方提供模型的AI繪圖工具,SD由于開源的關(guān)系,其模型數(shù)量幾乎可說是無窮無盡,每天都會(huì)有來自世界各地的機(jī)構(gòu)和個(gè)人通過各種渠道分享自己煉制的模型(還有更多是煉完自用不分享的),大到時(shí)空、物種、創(chuàng)作風(fēng)格,小到服飾、姿態(tài)、角色特征,都可以被煉制成不同類型的模型供SD調(diào)用——這就為AI圖像創(chuàng)作提供了近乎無限的可能性。</p> <p class="ql-block ql-indent-1">通過對(duì)模型的調(diào)用,我們可以輕而易舉的將蒙娜麗莎變成一個(gè)二次元少女,</p> <p class="ql-block">用水墨和油彩重新演繹梵高的《星空》,</p> <p class="ql-block">或者將原本只存在于文學(xué)、藝術(shù)和游戲動(dòng)漫作品中的角色帶到我們的世界。</p> <p class="ql-block ql-indent-1">當(dāng)然,在如此巨大的模型基數(shù)下,其質(zhì)量自然也難以避免的呈現(xiàn)良莠不齊的狀況。這也是為什么葫蘆叔會(huì)專門開一個(gè)系列來為大家做模型推薦——找到一組合適的模型,絕對(duì)可以讓你的AI圖像創(chuàng)作事半功倍。</p> <p class="ql-block ql-indent-1">當(dāng)然,除了checkpoint之外,SD中還有許多其它類型的模型,例如VAE模型——眼尖的小伙伴可能已經(jīng)發(fā)現(xiàn)了,就在剛剛那個(gè)checkpoint模型選框的旁邊,還有一個(gè)叫做VAE的選框。沒錯(cuò),就是它。</p> <p class="ql-block ql-indent-1">VAE的中文名稱是變分自編碼器,大家可以把它簡(jiǎn)單理解為一種自動(dòng)尋找規(guī)律提取關(guān)鍵信息的學(xué)習(xí)模型,我們下載的checkpoint模型里一般都會(huì)自帶VAE,而上圖這里讓我們選擇的實(shí)際上是一種輔助性的附加VAE,用于進(jìn)一步改善圖像的線條和色彩細(xì)節(jié)。其作用有些類似于PS中的濾鏡,效果如下圖:</p> <p class="ql-block ql-indent-1">嗯......幾乎看不出什么區(qū)別對(duì)吧~所以這里的VAE并非必選項(xiàng),一般也不會(huì)對(duì)最終成像效果產(chǎn)生太大的影響,大多數(shù)情況下都可以用效果更好也更加直觀的后期處理來替代,通常來說<span style="color:rgb(237, 35, 8);">無腦選擇vae-ft-mse-840000-ema-pruned.safetensors或者不選都可以</span><span style="color:rgb(1, 1, 1);">。</span>如果想了解更多可以去看看<a href="https://zhuanlan.zhihu.com/p/631452035" target="_blank" style="font-size:18px; background-color:rgb(255, 255, 255);">這篇文章</a>。</p> <p class="ql-block ql-indent-1">本來打算這期把所有模型基礎(chǔ)知識(shí)講完,但編輯下來發(fā)現(xiàn)內(nèi)容太多了,lora和embeddings模型就放到下期再講吧~建議大家利用空余時(shí)間自己動(dòng)手去加載各種不同風(fēng)格的checkpoint模型試一試出圖效果,在實(shí)踐中了解模型的作用和使用方法,過程中遇到問題也歡迎回到這里留言交流。</p>