目前 AI 話題相當火熱,AI 繪圖也吸引不少人加入使用行列,其中 Stable Diffusion 是一款相當知名且能離線使用的 AI 繪圖應用 (有線上版本),而開發者 N00MKRAD 為它製作了一款簡單易用的圖形化介面 NMKD Stable Diffusion GUI,無論 AMD 或 NVIDIA 顯示卡都能用,且整合 Python 與 Git 讓你無須另外安裝,以下筆者簡單介紹一下如何用該工具產生圖片。
NMKD Stable Diffusion GUI 簡易使用教學
軟體下載
按此前往下載頁面,點選 Download Now。
選擇是否贊助他們,不願意的話就按 No thanks, just take me to the downloads。
下載提供三種,第一種包含 Stable Diffusion v1.5 模型 (Including SD 1.5 model),第二種是不含模型 (No model files included),第三種是軟體更新,一般狀況下選擇第一種。
AMD APU 內顯設定
由於 AI 繪圖對顯示記憶體有所要求,建議的最低需求達到 4G (硬體需求請按此),筆者使用 AMD R5 5600G,因此到 BIOS 設定中把顯示記憶體拉到 4G,如果你有獨立顯示卡則略過此步驟。以筆者的技嘉 A520M-S2H 主機板為例,進到 BIOS 設定後,選擇 Settings,接著選 IO Ports。
然後把 Display Output 改為 IGD Video,Integrated Graphics 改 Forces,4G 以上解碼打開,Re-Size BAR 支援選自動,Buffer Size 就會顯示高於 2G 的選項,筆者這台主機安裝 32G 的記憶體,因此最多能分配 16G 的容量,假如你的記憶體只有裝到 16G,那還是開 4G 就好。
AMD 顯示卡專用設定
執行 StableDiffusionGui.exe,因為使用 AMD 顯示卡無法直接使用內附的模型,需要先進行轉換,點選右上角的扳手圖示,選擇 Convert Models。
Model File 應該會偵測到內附的 sd-v1-5-fp16.ckpt,Model Output Format 選擇 Diffusers ONNX,接著按下 Convert!,轉換中會顯示 Converting...,直到完成才會變回 Convert!,再按右上角的 X 關閉。如果之後要使用其他模型,也要先進行轉換才能用,模型路徑位於 Data/models 資料夾裡,可自行下載 CKPT 檔放到裡面再轉換,若勾選 Delete Input File If Successful 則轉換成功後會自動刪除 CKPT 避免佔用磁碟空間。
回到主畫面,點選右上角的齒輪圖示。
把 Image Generation Implementation 切換成 ONNX - DirectML - For AMD GPUs,注意一下 Stable Diffusion Model 有沒有出現剛剛轉換完的 sd-v1-5-fp16_onnx,確定模型有轉換成功卻沒顯示可以按 Refresh List 讓它重新偵測,如果依舊沒出現可能模型有問題,有多個模型可按旁邊的小箭頭切換,設定好按右上角的 X 關閉。
NVIDIA 顯示卡專用設定
此工具也能用在 NVIDIA 顯示卡上,點選主畫面右上角的齒輪圖示開啟設定,大於 4G 顯示記憶體的卡 Image Generation Implementation 選 Stable Diffusion - InvokeAI,假如你使用 GTX 1050 Ti 或 GTX 1650 之類 4G 顯示記憶體的卡,則選 Stable Diffusion OptimizedSD - CUDA - Low Memory Mode,最後在 Stable Diffusion Model 選擇你要用的模型,設定完按右上角 X 關閉。
產生圖片
執行 StableDiffusionGui.exe 後會開啟 Changelog,勾選下方的 Do Not Display This Message Again 接著按 OK,下次就不會再顯示。
在主畫面左上角的文字欄中輸入 Prompt 後按下方 Generate! 來產生圖片。
像筆者也是才剛接觸不太熟,所以就到 lexica.art 裡看看別人產生的圖,找個喜歡的圖片借鑑它的 Prompt。
點進去圖片,然後按 Copy prompt 複製,旁邊也會註明該圖用的模型給你參考。
把 Prompt 貼到左上角文字欄,Amount Of Image To Generate 可輸入你想產生的圖片數量,Resolution 則是圖片尺寸,設定好後按下方的 Generate! 按鍵開始產生圖片。產生過程中,下方的 Generate! 鍵會變成 Cancel!,按下去即可終止圖片產生。
依顯卡性能與顯示記憶體大小不同等待時間也會有差異,筆者的 R5 5600G 搭配兩條 16G DDR4-3200 的情況下,分配 4G 進行測試,產生一張圖片耗時 2 分 21 秒,如果你有中階以上的獨立顯示卡會比較快。
若想把圖片拉出來,就把游標移到圖片上按滑鼠右鍵,點選 Open Output Folder 即可開啟圖片儲存路徑。
簡單試了一下,同樣的 Prompt 用不同顯示記憶體設定的出圖速度差異,左邊設 4G 耗時 2 分 41 秒,右邊 8G 耗時 2分 27 秒,8G 快了 14 秒。
需要更多模型的話可以到 Hugging Face 網站上找,或搜尋別人用哪些模型。喜歡我們的文章歡迎分享,別忘了到 UH 粉絲專頁按讚並到追蹤設定中設為最愛,或是每天到 UH 網站逛逛,才不會錯過各種軟硬體資訊喔。
https://www.ylju.com/2913.html 這邊有人盜文
哭啊 ( ´•̥̥̥ω•̥̥̥` )