DMD2 モデル
コミュニティモデルコレクション の一部の NPU モデルは DMD2 LoRA がマージされているものがあります。わずかな画質の低下と引き換えに、大幅な高速化と発熱の大幅な低減が得られます。
DMD2 モデルの見分け方
ファイル名に _dmd2 が含まれているモデルは、DMD2 LoRA がチェックポイントにマージされています。例:
anythingxl_dmd2_qnn2.28_8gen3.zipサフィックスがない場合は通常の SDXL/SD1.5 チェックポイントとして、そのモデルの推奨設定で使用してください。
推奨パラメータ
DMD2 モデルは極低ステップ数と CFG 1 に最適化されています。以下を使用してください:
| パラメータ | 値 |
|---|---|
| サンプラー | LCM |
| CFG | 1 |
| ステップ数 | 8 |
DMD2 は高い CFG 値や DPM++ / Euler 系サンプラーでは正しく動作しません — 上記の組み合わせを使用してください。
なぜ速いのか
2 つの効果が重なります:
- ステップ数が少ない — 通常の 20〜30 ではなく 8 のため、UNet のパス回数が大幅に減ります。
- CFG = 1 最適化 — NPU パスでは、CFG がちょうど 1 のとき非条件付き UNet パスがスキップされ、各ステップの計算量が約半分になります(CFG ノートを参照)。
実測では、DMD2 モデルは同じベースモデルの通常設定と比べてエンドツーエンドで約 4 倍高速です。具体的な倍率は比較条件(ステップ数、CFG、ベースモデルが CFG 1 を使うかどうか)に依存します。
実測値(SDXL)
- 16 GB 以上のデバイスで 低 RAM モード をオフにして SDXL DMD2 を実行すると、1 枚あたり通常 6〜7 秒 で完了します。
- 1 回の生成が短いので、デバイスは冷たいまま — サーマルスロットリングを起こさずに連続して何枚も生成できます。
画質トレードオフ
DMD2 の出力品質はデフォルト設定で元のモデルの約 80〜90% です。差は主に細かいテクスチャや小さなディテールに現れ、全体の構図にはあまり影響しません。
速度と品質の両方を求める実用的なワークフロー:
- DMD2 モデルで候補を高速生成。
- 気に入ったものを 1 枚選ぶ。
- 元の(非 DMD2)モデル + img2img で中程度のデノイズ強度を使い、構図を保ちつつディテールを補強。
考え方は SD1.5 Highres.fix と同じ — DMD2 が構造を作り、フルモデルがディテールを仕上げます。
DMD2 を優先すべきとき
- プロンプトやシードを素早く試したい。
- セッション中に多数の画像を発熱なく生成したい。
- SDXL がギリギリ動くデバイスで、フルモデルが体感で遅すぎる。
1 枚の画像で最高品質を狙う場合は、非 DMD2 モデルを直接使うか、上記のように DMD2 で出力してから img2img で仕上げてください。