Stable Diffusion 入门指南
最后更新: 2026-03-26
难度: ⭐ 入门
📖 什么是 Stable Diffusion?
Stable Diffusion 是一种文本到图像生成模型,由 Stability AI 公司开发。它可以根据文字描述生成高质量、高分辨率的图像。
核心特点
| 特点 | 说明 |
|---|---|
| 🎨 文生图 | 输入文字描述,生成对应图像 |
| 🖼️ 图生图 | 基于现有图像进行变换和创作 |
| ✏️ 图像修复 | 智能修复或替换图像的特定区域 |
| 🎭 风格迁移 | 将艺术作品风格应用到照片上 |
| ⚡ 本地运行 | 可在个人电脑上离线使用 |
| 🔓 开源免费 | 完全开源,社区活跃 |
🚀 快速开始
方式一:在线使用(推荐新手)
适合人群: 不想安装软件,快速体验
| 平台 | 网址 | 特点 |
|---|---|---|
| DreamStudio | https://dreamstudio.ai | 官方平台,效果好 |
| Clipdrop | https://clipdrop.co | Stability AI 旗下 |
| Hugging Face | https://huggingface.co/spaces | 免费试用 |
方式二:本地安装(推荐进阶)
适合人群: 需要频繁使用,注重隐私
系统要求
| 组件 | 最低要求 | 推荐配置 |
|---|---|---|
| 显卡 | NVIDIA GTX 1060 6GB | RTX 3060 12GB 或更高 |
| 内存 | 8GB | 16GB 或更高 |
| 存储 | 10GB 可用空间 | 50GB SSD |
| 系统 | Windows 10/11 | Windows 11 |
安装方案对比
| 方案 | 难度 | 功能 | 推荐度 |
|---|---|---|---|
| Stability Matrix | ⭐ 简单 | 完整 | ⭐⭐⭐⭐⭐ |
| WebUI Forge | ⭐⭐ 中等 | 完整 | ⭐⭐⭐⭐ |
| ComfyUI | ⭐⭐⭐ 较难 | 专业 | ⭐⭐⭐ |
📦 推荐安装方案:Stability Matrix
Stability Matrix 是一键安装包,自动管理所有依赖。
安装步骤
1. 下载安装包
下载地址:https://github.com/LykosAI/StabilityMatrix/releases
选择:StabilityMatrix-Windows-Shareable.exe2. 运行安装程序
1. 双击运行安装程序
2. 选择安装路径(建议 D 盘,至少 50GB 空间)
3. 选择要安装的包(推荐:Stable Diffusion WebUI)
4. 点击安装,等待完成3. 启动 WebUI
1. 打开 Stability Matrix
2. 点击"启动"按钮
3. 浏览器自动打开 http://localhost:7860🎯 第一个图像生成
步骤 1:打开 WebUI
浏览器访问:http://localhost:7860
步骤 2:输入提示词
正向提示词(想要的):
a beautiful sunset over mountains, golden hour, highly detailed, 8k
(美丽的山间日落,黄金时刻,高度细节,8k 分辨率)负向提示词(不想要的):
ugly, blurry, low quality, distorted, watermark
(丑陋、模糊、低质量、扭曲、水印)步骤 3:调整参数
| 参数 | 推荐值 | 说明 |
|---|---|---|
| Sampling Steps | 20-30 | 步数越多质量越高 |
| CFG Scale | 7 | 提示词相关性(1-20) |
| Width/Height | 512x512 | 图像尺寸 |
| Seed | -1 | 随机种子(-1=随机) |
步骤 4:点击生成
等待 10-30 秒,图像生成完成!
📚 核心概念解析
1. 提示词(Prompt)
定义: 描述你想要生成图像的文字
格式:
主体 + 细节 + 风格 + 质量词示例:
a cute cat, fluffy fur, blue eyes, sitting on windowsill,
sunlight, photorealistic, highly detailed, 8k, masterpiece2. 采样器(Sampler)
作用: 控制图像生成的算法
常用采样器:
| 采样器 | 速度 | 质量 | 适用场景 |
|---|---|---|---|
| Euler a | ⚡⚡⚡ | ⭐⭐⭐⭐ | 快速出图 |
| DPM++ 2M Karras | ⚡⚡ | ⭐⭐⭐⭐⭐ | 高质量 |
| DDIM | ⚡⚡⚡ | ⭐⭐⭐ | 图生图 |
3. 步数(Steps)
定义: 生成图像的去噪迭代次数
| 步数 | 效果 | 耗时 |
|---|---|---|
| 10-15 | 基础轮廓 | 快 |
| 20-30 | 良好质量 | 中等(推荐) |
| 40-50 | 精细细节 | 慢 |
4. CFG Scale
定义: 提示词引导系数(1-20)
| 数值 | 效果 |
|---|---|
| 1-3 | 自由发挥,可能偏离提示 |
| 5-7 | 平衡创作和提示(推荐) |
| 10-15 | 严格遵循提示 |
| 16-20 | 过度饱和,不自然 |
🎨 实用技巧
技巧 1:提示词公式
[主体] + [动作/场景] + [环境] + [风格] + [质量词]示例:
[一位女战士] + [手持光剑] + [在太空站] + [赛博朋克风格] + [8k 超精细]技巧 2:权重控制
语法: (关键词:权重)
(cat:1.3) sitting on (bench:0.8)
(猫的权重 1.3,长椅权重 0.8)技巧 3:多个概念组合
语法: 使用 AND 连接
beautiful garden AND sunset AND cherry blossoms技巧 4:避免常见问题
| 问题 | 解决方法 |
|---|---|
| 手指畸形 | 添加负向提示词 bad hands, mutated fingers |
| 画面模糊 | 增加 Steps 到 30+,添加 sharp, detailed |
| 颜色暗淡 | 添加 vibrant colors, bright |
| 构图混乱 | 简化提示词,降低 CFG 到 5-6 |
📁 常用质量词
正面质量词
masterpiece, best quality, high quality, ultra-detailed,
8k, photorealistic, realistic, sharp focus, cinematic lighting负面质量词
ugly, duplicate, morbid, mutilated, poorly drawn,
bad anatomy, wrong anatomy, extra limbs, missing limbs,
blurry, low quality, worst quality🔧 常见问题解答
Q1: 生成速度慢怎么办?
解决方案:
- 降低图像分辨率(512x512 → 384x384)
- 减少采样步数(30 → 20)
- 使用更快的采样器(Euler a)
- 启用 xFormers 加速
Q2: 生成的图像不好看怎么办?
解决方案:
- 优化提示词,增加细节描述
- 调整 CFG Scale(5-9 之间尝试)
- 更换采样器
- 使用高质量模型(见模型章节)
Q3: 显存不足怎么办?
解决方案:
- 使用
--medvram或--lowvram参数启动 - 降低图像分辨率
- 启用
--opt-split-attention - 关闭其他占用显存的程序
Q4: 如何保存提示词?
解决方案:
- WebUI 的"Save prompt"功能
- 使用 PNG Info 查看历史
- 建立提示词文档记录
📖 学习路线
第 1 周:基础入门
- [ ] 安装 Stability Matrix
- [ ] 生成第一张图像
- [ ] 理解提示词基本结构
- [ ] 掌握核心参数调节
第 2 周:进阶技巧
- [ ] 学习提示词权重控制
- [ ] 尝试不同采样器
- [ ] 练习图生图功能
- [ ] 了解模型差异
第 3 周:高级应用
- [ ] 掌握 ControlNet 控制
- [ ] 学习 LoRA 模型使用
- [ ] 尝试图像修复
- [ ] 创建个性化工作流
第 4 周:专业创作
- [ ] 训练自己的 LoRA
- [ ] 批量生成工作流
- [ ] 后期处理技巧
- [ ] 作品发布与分享
🔗 相关资源
官方资源
社区资源
中文资源
📝 下一章预告
- 主流模型对比
- 模型下载与安装
- 模型融合技巧
- 根据场景选择模型
本教程持续更新中 | 2026-03-26
