概要
Dynamic Thresholding(CFG-Fix)は、Stable Diffusion WebUI Forgeに統合されたControlNet Integratedの機能の一つで、画像生成時の設定を動的に調整することで、より自然で魅力的な画像を生成するためのツールです。特に、CFGスケール(Classification Free Guidance Scale)の調整に役立ちます。CFGスケールは、プロンプトの影響力を制御するパラメータであり、これを適切に設定することで、よりバランスの取れた画像を生成できます。Dynamic Thresholdingは、このCFGスケールを自動的に調整し、最適な結果を得るための機能です。
前提条件
Dynamic Thresholding(CFG-Fix)を使用するために、以下の条件を満たしている必要があります。
- Stable Diffusion WebUI Forgeがインストールされており、正常に動作していること(WebUIは
webui-user.bat
を実行することで起動します)。 - 基本的な操作スキル: ファイルのダウンロードや設定変更ができること。
- ControlNet Integratedのインストール: Dynamic Thresholding機能はControlNetの一部として提供されるため、ControlNet Integratedがインストールされていることが必要です。
手順
webui-user.bat
ファイルをダブルクリックして、Stable Diffusion WebUI Forgeを起動します。ブラウザが自動的に開き、WebUIが表示されます。
WebUIのメニューから「Dynamic Thresholding」タブをクリックします。
Dynamic Thresholdingの有効化
この設定により、画像生成中にCFGスケールが動的に調整され、最適なバランスが取られます。
CFGスケールの初期設定
必要に応じて、初期のCFGスケール値を設定します。この値は、プロンプトの影響度をどの程度強調するかを決定します。通常は7ですが、生成したい画像のスタイルや目的に応じて調整します。
- 低いCFGスケール(~6)
-
- 効果: CFGスケールが低いと、生成される画像がより柔らかく、ランダム性が高くなります。これにより、モデルが提供する創造的な自由度が増し、結果として得られる画像は指示(プロンプト)からやや離れることがあります。
- 使用シナリオ: より芸術的で抽象的な結果を得たい場合や、柔らかい表現が求められるシーンでは、低めのCFGスケールが適しています。
- 高いCFGスケール(8~)
-
- 効果: 高いCFGスケールは、プロンプトに非常に厳密に従うようになりますが、その結果として、画像が不自然になったり、アーティファクトが発生したりするリスクが高まります。生成される画像は非常に指示に忠実ですが、過度に制約された結果になることがあります。
- 使用シナリオ: 明確で具体的な画像生成が求められるシーンや、プロンプトに厳密に従わせたい場合に適していますが、バランスを崩さないように注意が必要です。
「Enable ControlNet」をオンに
Dynamic Thresholding(CFG-Fix)を有効化するために、「Enable ControlNet」をオンにします。
WebUIの「txt2img」または「img2img」タブに移動し、通常通りPromptを入力します。CFGスケール(クラス条件付きガイダンスの強度)を設定します。通常は7-15の範囲が一般的ですが、Dynamic Thresholdingを使用することで、設定したスケールに基づいてCFGが動的に調整されます。
設定が完了したら、「Generate」ボタンをクリックして画像生成を開始します。Dynamic Thresholding (CFG-Fix)が適用され、より安定した高品質な画像が生成されます。
Dynamic Thresholding (CFG-Fix)は、初心者でも簡単に利用できる拡張機能であり、画像生成の品質を大幅に向上させることができます。特に、CFGの設定に悩むことが多いユーザーにとって、この機能は強力なサポートとなるでしょう。ぜひ、この拡張機能を活用して、理想的な画像生成を実現してください。