Skip to content

Stable Diffusion 入门指南

最后更新: 2026-03-26
难度: ⭐ 入门


📖 什么是 Stable Diffusion?

Stable Diffusion 是一种文本到图像生成模型,由 Stability AI 公司开发。它可以根据文字描述生成高质量、高分辨率的图像。

核心特点

特点说明
🎨 文生图输入文字描述,生成对应图像
🖼️ 图生图基于现有图像进行变换和创作
✏️ 图像修复智能修复或替换图像的特定区域
🎭 风格迁移将艺术作品风格应用到照片上
本地运行可在个人电脑上离线使用
🔓 开源免费完全开源,社区活跃

🚀 快速开始

方式一:在线使用(推荐新手)

适合人群: 不想安装软件,快速体验

平台网址特点
DreamStudiohttps://dreamstudio.ai官方平台,效果好
Clipdrophttps://clipdrop.coStability AI 旗下
Hugging Facehttps://huggingface.co/spaces免费试用

方式二:本地安装(推荐进阶)

适合人群: 需要频繁使用,注重隐私

系统要求

组件最低要求推荐配置
显卡NVIDIA GTX 1060 6GBRTX 3060 12GB 或更高
内存8GB16GB 或更高
存储10GB 可用空间50GB SSD
系统Windows 10/11Windows 11

安装方案对比

方案难度功能推荐度
Stability Matrix⭐ 简单完整⭐⭐⭐⭐⭐
WebUI Forge⭐⭐ 中等完整⭐⭐⭐⭐
ComfyUI⭐⭐⭐ 较难专业⭐⭐⭐

📦 推荐安装方案:Stability Matrix

Stability Matrix 是一键安装包,自动管理所有依赖。

安装步骤

1. 下载安装包

下载地址:https://github.com/LykosAI/StabilityMatrix/releases
选择:StabilityMatrix-Windows-Shareable.exe

2. 运行安装程序

1. 双击运行安装程序
2. 选择安装路径(建议 D 盘,至少 50GB 空间)
3. 选择要安装的包(推荐:Stable Diffusion WebUI)
4. 点击安装,等待完成

3. 启动 WebUI

1. 打开 Stability Matrix
2. 点击"启动"按钮
3. 浏览器自动打开 http://localhost:7860

🎯 第一个图像生成

步骤 1:打开 WebUI

浏览器访问:http://localhost:7860

步骤 2:输入提示词

正向提示词(想要的):

a beautiful sunset over mountains, golden hour, highly detailed, 8k
(美丽的山间日落,黄金时刻,高度细节,8k 分辨率)

负向提示词(不想要的):

ugly, blurry, low quality, distorted, watermark
(丑陋、模糊、低质量、扭曲、水印)

步骤 3:调整参数

参数推荐值说明
Sampling Steps20-30步数越多质量越高
CFG Scale7提示词相关性(1-20)
Width/Height512x512图像尺寸
Seed-1随机种子(-1=随机)

步骤 4:点击生成

等待 10-30 秒,图像生成完成!


📚 核心概念解析

1. 提示词(Prompt)

定义: 描述你想要生成图像的文字

格式:

主体 + 细节 + 风格 + 质量词

示例:

a cute cat, fluffy fur, blue eyes, sitting on windowsill, 
sunlight, photorealistic, highly detailed, 8k, masterpiece

2. 采样器(Sampler)

作用: 控制图像生成的算法

常用采样器:

采样器速度质量适用场景
Euler a⚡⚡⚡⭐⭐⭐⭐快速出图
DPM++ 2M Karras⚡⚡⭐⭐⭐⭐⭐高质量
DDIM⚡⚡⚡⭐⭐⭐图生图

3. 步数(Steps)

定义: 生成图像的去噪迭代次数

步数效果耗时
10-15基础轮廓
20-30良好质量中等(推荐)
40-50精细细节

4. CFG Scale

定义: 提示词引导系数(1-20)

数值效果
1-3自由发挥,可能偏离提示
5-7平衡创作和提示(推荐)
10-15严格遵循提示
16-20过度饱和,不自然

🎨 实用技巧

技巧 1:提示词公式

[主体] + [动作/场景] + [环境] + [风格] + [质量词]

示例:

[一位女战士] + [手持光剑] + [在太空站] + [赛博朋克风格] + [8k 超精细]

技巧 2:权重控制

语法: (关键词:权重)

(cat:1.3) sitting on (bench:0.8)
(猫的权重 1.3,长椅权重 0.8)

技巧 3:多个概念组合

语法: 使用 AND 连接

beautiful garden AND sunset AND cherry blossoms

技巧 4:避免常见问题

问题解决方法
手指畸形添加负向提示词 bad hands, mutated fingers
画面模糊增加 Steps 到 30+,添加 sharp, detailed
颜色暗淡添加 vibrant colors, bright
构图混乱简化提示词,降低 CFG 到 5-6

📁 常用质量词

正面质量词

masterpiece, best quality, high quality, ultra-detailed, 
8k, photorealistic, realistic, sharp focus, cinematic lighting

负面质量词

ugly, duplicate, morbid, mutilated, poorly drawn, 
bad anatomy, wrong anatomy, extra limbs, missing limbs, 
blurry, low quality, worst quality

🔧 常见问题解答

Q1: 生成速度慢怎么办?

解决方案:

  1. 降低图像分辨率(512x512 → 384x384)
  2. 减少采样步数(30 → 20)
  3. 使用更快的采样器(Euler a)
  4. 启用 xFormers 加速

Q2: 生成的图像不好看怎么办?

解决方案:

  1. 优化提示词,增加细节描述
  2. 调整 CFG Scale(5-9 之间尝试)
  3. 更换采样器
  4. 使用高质量模型(见模型章节)

Q3: 显存不足怎么办?

解决方案:

  1. 使用 --medvram--lowvram 参数启动
  2. 降低图像分辨率
  3. 启用 --opt-split-attention
  4. 关闭其他占用显存的程序

Q4: 如何保存提示词?

解决方案:

  1. WebUI 的"Save prompt"功能
  2. 使用 PNG Info 查看历史
  3. 建立提示词文档记录

📖 学习路线

第 1 周:基础入门

  • [ ] 安装 Stability Matrix
  • [ ] 生成第一张图像
  • [ ] 理解提示词基本结构
  • [ ] 掌握核心参数调节

第 2 周:进阶技巧

  • [ ] 学习提示词权重控制
  • [ ] 尝试不同采样器
  • [ ] 练习图生图功能
  • [ ] 了解模型差异

第 3 周:高级应用

  • [ ] 掌握 ControlNet 控制
  • [ ] 学习 LoRA 模型使用
  • [ ] 尝试图像修复
  • [ ] 创建个性化工作流

第 4 周:专业创作

  • [ ] 训练自己的 LoRA
  • [ ] 批量生成工作流
  • [ ] 后期处理技巧
  • [ ] 作品发布与分享

🔗 相关资源

官方资源

社区资源

中文资源


📝 下一章预告

02-模型选择指南

  • 主流模型对比
  • 模型下载与安装
  • 模型融合技巧
  • 根据场景选择模型

本教程持续更新中 | 2026-03-26