Skip to content

DMD2 モデル

コミュニティモデルコレクション の一部の NPU モデルは DMD2 LoRA がマージされているものがあります。わずかな画質の低下と引き換えに、大幅な高速化と発熱の大幅な低減が得られます。

DMD2 モデルの見分け方

ファイル名に _dmd2 が含まれているモデルは、DMD2 LoRA がチェックポイントにマージされています。例:

anythingxl_dmd2_qnn2.28_8gen3.zip

サフィックスがない場合は通常の SDXL/SD1.5 チェックポイントとして、そのモデルの推奨設定で使用してください。

推奨パラメータ

DMD2 モデルは極低ステップ数と CFG 1 に最適化されています。以下を使用してください:

パラメータ
サンプラーLCM
CFG1
ステップ数8

DMD2 は高い CFG 値や DPM++ / Euler 系サンプラーでは正しく動作しません — 上記の組み合わせを使用してください。

なぜ速いのか

2 つの効果が重なります:

  1. ステップ数が少ない — 通常の 20〜30 ではなく 8 のため、UNet のパス回数が大幅に減ります。
  2. CFG = 1 最適化 — NPU パスでは、CFG がちょうど 1 のとき非条件付き UNet パスがスキップされ、各ステップの計算量が約半分になります(CFG ノートを参照)。

実測では、DMD2 モデルは同じベースモデルの通常設定と比べてエンドツーエンドで約 4 倍高速です。具体的な倍率は比較条件(ステップ数、CFG、ベースモデルが CFG 1 を使うかどうか)に依存します。

実測値(SDXL)

  • 16 GB 以上のデバイスで 低 RAM モード をオフにして SDXL DMD2 を実行すると、1 枚あたり通常 6〜7 秒 で完了します。
  • 1 回の生成が短いので、デバイスは冷たいまま — サーマルスロットリングを起こさずに連続して何枚も生成できます。

画質トレードオフ

DMD2 の出力品質はデフォルト設定で元のモデルの約 80〜90% です。差は主に細かいテクスチャや小さなディテールに現れ、全体の構図にはあまり影響しません。

速度と品質の両方を求める実用的なワークフロー:

  1. DMD2 モデルで候補を高速生成。
  2. 気に入ったものを 1 枚選ぶ。
  3. 元の(非 DMD2)モデル + img2img で中程度のデノイズ強度を使い、構図を保ちつつディテールを補強。

考え方は SD1.5 Highres.fix と同じ — DMD2 が構造を作り、フルモデルがディテールを仕上げます。

DMD2 を優先すべきとき

  • プロンプトやシードを素早く試したい。
  • セッション中に多数の画像を発熱なく生成したい。
  • SDXL がギリギリ動くデバイスで、フルモデルが体感で遅すぎる。

1 枚の画像で最高品質を狙う場合は、非 DMD2 モデルを直接使うか、上記のように DMD2 で出力してから img2img で仕上げてください。