Stable Diffusion 的 Guidance Scale 是什麼?


Guidance Scale

導引尺度(Guidance Scale),或稱為無分類引導尺度 (CFG),是人工智慧 (AI) 中使用的參數,用於確定 AI 藝術生成過程對文字提示的遵循程度。它是一個特定的數字或值,代表人工智慧產生的文字提示或圖像描述的重要性。

具有高指導比例的圖像會遵循所提供的文字提示,並且可能缺乏足夠的創造力。因此,您的目標應該是在每個影像生成過程中實現較低的 CFG 值,但不要達到極低的值。始終嘗試將數字保持在七到九之間,以獲得高品質的結果。 

在本文中,我們將深入探討如何使用穩定擴散中的引導比例來增強影像。

指導量表的工作原理

比例是產生 AI 圖像的過程與給定文字提示相符的程度。使用人工智慧圖像產生器時,您可以向其提供描述所需圖像類型的文字。這些文字提示引導您的 AI 模型產生具有所有定義特徵的圖像。

確保您的模型遵循文字提示中提供的說明非常重要 - 這就是指導量表派上用場的地方。它控製影像產生過程遵循提示中提供的說明的程度,確保最終影像滿足您的需求。

引導比例較低的圖像創建過程意味著人工智慧模型可以更自由地在結果中融入創造力,而不是對較高數字可能出現的提示進行更字面的解釋。在穩定擴散中,大多數模型的預設引導比例值在 7 到 7.5 之間。

較低的數字在最終圖像中包含更多的創造力,而較高的數字表示圖像與文字提示緊密相關。因此,檢查您的 AI 模型是否有足夠的創造力來產生您設想的圖像非常重要。即使您 免費使用人工智慧藝術生成器,這一點也很重要。

指導標度如何在穩定擴散中發揮作用
穩定擴散是一種流行的深度學習模型,可幫助藝術家和內容創作者使用簡單的文字提示和來源圖像生成逼真的圖像。該模型於 2022 年推出,使用擴散技術來產生影像。

程式設計師已經找到了使用其他先進的人工智慧技術和技術(如導引尺度、ControlNet 和 LoRA)來增強穩定擴散模型效能的方法。如果您想產生更好的影像,了解如何將這些附加技術合併到穩定擴散模型中非常重要。

例如,如果您了解LoRA 技術在穩定擴散中的操作原理,您將能夠更有效地利用它。您還需要花一些時間探索 ControlNet 在穩定擴散中的作用。 

在穩定擴散中,引導比例控制最終影像與文字提示的黏附程度。將指導尺度視為整體提示強度。指導尺度越高,模型發揮創意的空間就越小。您在影像生成過程中設定的值將取決於您想要的結果。

結果也取決於文字提示的複雜性,但決定權完全由您決定。儘管如此,在設定最終值之前,您應該始終嘗試幾種指導量表,以了解每種量表可能為您提供的結果類型。 

這樣,您就可以判斷是選擇一種讓您的模型更具創造性的比例,還是選擇強制模型嚴格遵循文字提示的比例。如果您想要建立包含提示中包含的微小細節的影像,請將初始指導比例設定得較高,並在微調影像時將其縮小。

沒有留言:

張貼留言

你發現了這篇網誌的留言板,在這留點什麼吧|д・)