可用模型
内置模型
以下模型可以直接在应用内下载。
| 模型 | 类型 | CPU/GPU | NPU | Clip Skip | 来源 |
|---|---|---|---|---|---|
| SDXL Base 1.0 | SDXL | ❌ | ✅ | - | HuggingFace |
| Illustrious v16 | SDXL | ❌ | ✅ | - | CivitAI |
| AnythingV5 | SD1.5 | ✅ | ✅ | 2 | CivitAI |
| ChilloutMix | SD1.5 | ✅ | ✅ | 1 | CivitAI |
| Absolute Reality | SD1.5 | ✅ | ✅ | 2 | CivitAI |
| QteaMix | SD1.5 | ✅ | ✅ | 2 | CivitAI |
| CuteYukiMix | SD1.5 | ✅ | ✅ | 2 | CivitAI |
TIP
请参考每个模型的原始页面获取推荐的提示词、采样器和 CFG 值。
SDXL 仅支持 NPU
SDXL checkpoint 体积过大,在手机上以 CPU/GPU 模式运行不现实,因此 Local Dream 只在 NPU 路径下支持 SDXL。SD1.5 三种路径(CPU / GPU / NPU)都支持。
不同模型可能偏好明显不同的设置。尽量从模型官方发布页面的示例参数开始。
社区预转换模型
社区维护的 NPU 模型集合(SD1.5 和 SDXL):
文件名后缀表示运行该模型所需的 最低芯片级别。高级别芯片可以运行低级别的模型;选择你设备支持的最高后缀以获得最佳性能。
SD1.5:
_min— 具有 Hexagon V68 及以上的骁龙 NPU(非旗舰芯片)_8gen1— 骁龙 8 Gen 1 / 8+ Gen 1_8gen2— 骁龙 8 Gen 2 及以上(2 / 3 / 8 Elite / 8s Gen 4 / 8 Elite Gen 5)
SDXL:
_8gen3— 骁龙 8 Gen 3 及以上(3 / 8 Elite / 8 Elite Gen 5,这是唯一的 SDXL 后缀)
部分社区模型文件名还会包含 _dmd2 —— 这类模型融合了 DMD2 LoRA,需要使用专门的参数(LCM / CFG 1 / 8 步)。它们大约快 4 倍、发热显著更低,画质有少量损失。详见 DMD2 模型。
关于分辨率补丁(仅 SD1.5 NPU)
SD1.5 NPU 的 zip 包内附带一个基础 512×512 UNet,外加可选的分辨率补丁用于额外分辨率(如 768×512、1024×768)。补丁是 zip 包内同名 .patch 小文件(通常几 MB 到 ~10 MB,使用 zstd --patch-from 基于基础 UNet 生成)—— 不是单独下载的内容。
- 是否包含额外分辨率取决于模型打包者:有的只打包 512×512,有的打包完整集合。
- 在模型运行界面切换分辨率时,应用会实时应用补丁。切换会重新加载 UNet(1–2 秒),CLIP 和 VAE 保持不变。
- 非旗舰芯片(
_min级别)不支持分辨率补丁。
标识文件
部分 .zip 包根目录下包含一些标识文件,用来告诉应用如何处理该模型。这些文件没有内容 —— 仅靠"文件是否存在"来标识:
SDXL—— 表示该包是 SDXL 模型。没有这个文件时,应用会按 SD1.5 加载。V_PRED—— 表示该 UNet 使用 v-prediction 而非标准的 ε-prediction。应用会自动检测并切换对应的采样器算法。
内置模型与社区预转换的包都已包含正确的标识文件 —— 只有当你自己打包模型时才需要考虑。
自定义模型
CPU/GPU 模式(应用内)
直接在应用中导入 SD1.5 模型文件,转换在设备上完成。如果需要使用 LoRA,请在导入前将其合并到原始模型中。
v_prediction 模型 会被自动检测:如果模型使用 v-prediction 而非标准 ε-prediction,模型目录中必须存在 V_PRED 标记文件。内置模型和正确打包的转换会自动处理此问题。
NPU 模式(主机端转换)
NPU 模型必须在 Linux/WSL 主机上转换后才能加载。详见:
- SD1.5 转换指南
- SDXL 转换指南(实验性)
技术细节
NPU
- SDK:Qualcomm QNN SDK,运行在 Hexagon NPU 上
- 量化:W8A16 静态量化
- 分辨率:SD1.5 基础 512×512;额外分辨率(512×768、768×512、768×1024、1024×768)通过补丁提供,需 8 Gen 1 及以上。SDXL 内部固定在 1024×1024,但支持任意宽高比(长边 = 1024,短边按比例计算)—— 详见 SDXL 宽高比。
- 性能:推理速度极快
CPU/GPU
- 框架:MNN
- 量化:W8 动态量化
- 分辨率:128×128、256×256、384×384、512×512
- 性能:速度适中,兼容性强