切换语言
切换主题

ComfyUI 入门完整指南:从安装到第一张 Stable Diffusion 图片

ComfyUI 入门最容易卡住的地方,不是“会不会写 prompt”,而是第一次打开界面时看到一整张节点图:Load CheckpointCLIP Text EncodeKSamplerVAE DecodeSave Image。很多人会误以为自己必须先学扩散模型原理,才能生成第一张图。

先别急。新手阶段只需要把 ComfyUI 理解成一条可视化生成流水线:模型提供生成能力,提示词描述画面,采样器负责逐步生成,保存节点输出图片。本文只解决一个窄问题:怎么选安装方式、怎么放模型、怎么跑通默认文生图 workflow,以及第一轮报错该按什么顺序排查。

核心结论

你现在的情况建议路线先别折腾什么
Windows + NVIDIA 显卡,只想快点出图Desktop 或 Windows portable先不要手动配 Python 环境
macOS Apple SiliconDesktop先不要套用 Windows CUDA 教程
Linux 或需要控制 PyTorch/CUDAManual install先不要复制别人的整套环境变量
没有本地 GPU,只想理解工作流Comfy Cloud先不要买模型或硬件
已有 Automatic1111 模型库本地安装 + extra_model_paths.yaml先不要重复复制几十 GB 模型

第一天的目标不是“做出很好看的图”,而是确认三件事:ComfyUI 能启动,Load Checkpoint 能读到模型,默认文生图工作流能跑完。只要这三件事通了,后面再学 LoRA、ControlNet、IP-Adapter、复杂工作流,排错会轻很多。

ComfyUI 到底是什么

ComfyUI 是一个开源的节点式生成式 AI 界面和推理引擎。它和一些“填表单式”的 Stable Diffusion 工具不太一样:你不是只在一个面板里填 prompt、尺寸和 seed,而是在画布上看到一条由节点组成的流程。

一条最小文生图流程可以拆成五段:

  1. Load Checkpoint:加载基础模型,比如 SD 1.5、SDXL 或其他 checkpoint。
  2. CLIP Text Encode:把正向 prompt 和负向 prompt 转成模型能使用的条件。
  3. KSampler:按照采样步数、seed、CFG 等参数生成 latent。
  4. VAE Decode:把 latent 解码成图片。
  5. Save Image:把结果保存到输出目录。

这就是新手需要先看懂的最小链路。复杂工作流只是把这些步骤拆得更细,或者在中间插入更多节点:比如 ControlNet 读取姿势图,IP-Adapter 参考一张人物图,LoRA 改变风格,Upscale 节点放大图片。

节点图为什么看起来吓人

ComfyUI 把很多隐藏步骤摊开给你看。好处是可控,坏处是第一次看到会觉得“每个节点都要懂”。其实不用。你可以先按水流方向看:从左到右、从上到下,找到模型、提示词、采样器、保存节点即可。

排错也按这个方向来。模型没读到,后面肯定跑不动;prompt 写得很弱,结果可能很糊;采样器参数乱改,图像会变得不稳定;保存节点没接上,你可能以为没出图。

安装方式怎么选

官方文档给了多条路线,包括 Desktop、portable、manual install 和 cloud。新手真正要做的不是“选最强路线”,而是选最少阻力的路线。

Desktop:适合大多数第一次尝试

Desktop 的优势是省心。你不需要一上来判断 Python 版本、PyTorch 版本、CUDA 后端,也不用自己创建虚拟环境。对 macOS Apple Silicon 用户来说,Desktop 也是官方文档中更自然的入口。

它的边界也要知道:官方文档说明 Desktop 基于稳定版本构建,最新功能可能比 portable 或手动安装晚一些。这个限制对第一张图影响不大。等你开始使用新节点、新模型格式或调试插件兼容性,再考虑切换安装方式。

Windows portable:适合 NVIDIA 显卡用户

Windows + NVIDIA 显卡通常是 Stable Diffusion 本地出图的常见组合。portable 包的好处是路径清楚,文件结构也更接近很多教程中的写法。你会直接看到 ComfyUI/models/ComfyUI/output/ 这类目录,排查模型位置比较方便。

如果你只是想学习 ComfyUI,本地 portable 已经够用。不要第一天就把 custom nodes、Manager、几十个模型、十几个 LoRA 全装进去。新手最常见的麻烦不是“功能不够”,而是装太多后不知道哪一步坏了。

Manual install:适合需要控制环境的人

手动安装更适合 Linux 用户、开发者,或者已经知道自己需要控制 Python、PyTorch、CUDA/ROCm/MPS 后端的人。它的优点是灵活,缺点是报错空间更大。

如果你选择手动安装,建议把环境当成独立项目管理:

git clone https://github.com/comfy-org/ComfyUI.git
cd ComfyUI
python -m venv venv
source venv/bin/activate
pip install -r requirements.txt
python main.py

这段命令只是说明手动安装的一般结构。实际 PyTorch 后端、显卡驱动和系统差异要按官方手动安装文档处理,不要从旧教程里复制一段 CUDA 命令就直接跑。

Cloud:适合先体验工作流

如果你暂时没有本地 GPU,或者只是想知道 ComfyUI 是不是适合自己,可以先用云端路线体验。它不能替代本地环境学习,但可以帮你先理解节点、workflow、模型和 prompt 之间的关系。

等你确认自己要长期使用,再回到本地安装。这样比一开始就买硬件、下载一堆模型更稳。

模型目录怎么放

很多 ComfyUI 入门问题最后都会落到同一句话:Load Checkpoint 为什么是空的?

官方文档说明,多数安装不会自带基础模型。模型一般放在 ComfyUI 安装目录下的 models/,常见子目录如下:

文件类型常见目录用途
checkpoint / .safetensors / .ckptComfyUI/models/checkpoints/基础生图模型
LoRAComfyUI/models/loras/风格、角色、动作或概念微调
VAEComfyUI/models/vae/图像解码,影响色彩和细节
embedding / textual inversionComfyUI/models/embeddings/特定词向量触发效果
upscale modelComfyUI/models/upscale_model/图片放大

第一张图只需要先处理 checkpoint。把一个可用的基础模型放到 models/checkpoints/,启动或刷新 ComfyUI,然后在 Load Checkpoint 下拉框里选择它。

Desktop 的模型目录可能不一样

Desktop 用户不要死盯网上教程里的 portable 路径。官方文档提到,Desktop 可以通过菜单里的 Help / Open folder / Open models folder 找到模型目录。你应该以软件打开的目录为准,而不是照搬别人的安装路径。

如果你已经有 Automatic1111、Forge 或其他工具的模型库,可以考虑配置 extra_model_paths.yaml。这样 ComfyUI 会读取外部模型目录,你不用把几十 GB 文件复制一遍。

一个常见判断标准是:

  • 只有一两个模型:直接放到 ComfyUI 对应目录。
  • 已有大量模型:用 extra_model_paths.yaml 映射。
  • 还不知道自己会不会长期用:先不要整理复杂模型库。

跑出第一张图

跑第一张图时,先用默认 workflow,不要打开别人分享的复杂 JSON。默认流程的价值是“变量少”:只要它能跑,说明环境、模型和基础节点是通的。

操作步骤

  1. 启动 ComfyUI,打开网页界面。
  2. 加载默认 Image Generation workflow。
  3. 如果界面提示缺模型,按提示安装,或手动下载后放进 models/checkpoints/
  4. Load Checkpoint 里选择模型。
  5. 在正向 prompt 写画面主体,例如 a cozy desk setup, soft light, detailed illustration
  6. 在负向 prompt 写不想要的内容,例如 blurry, low quality, distorted hands
  7. 先用默认尺寸、默认 sampler、默认 steps,不要一次改太多。
  8. 点击 Run,或使用 Ctrl + Enter
  9. Save Image 节点、界面输出区或 output/ 目录查看结果。

如果第一张图很普通,甚至不太好看,也没关系。它只是在证明链路通了。你真正需要记录的是:用了哪个模型、哪个 prompt、有没有报错、输出目录在哪里。

第一次 prompt 怎么写

新手 prompt 不要写得太抽象。比如“好看的女孩”“未来城市”这类词,模型可以生成,但你很难判断效果为什么不好。更适合第一轮验证的 prompt 是:

a small wooden cabin beside a lake, morning fog, soft sunlight, detailed illustration, calm mood

负向 prompt 可以先简单写:

blurry, low quality, distorted, extra fingers, bad anatomy

不要在第一轮就堆很多风格词、相机词和艺术家名。你先让模型稳定输出,再逐步调整 prompt、尺寸、steps、CFG 和 seed。

第一轮报错怎么排查

排错时按顺序来,别一边重装环境,一边换模型,一边改 workflow。你每次只改一个变量,才知道问题在哪里。

Load Checkpoint 为空或显示 null

先检查三件事:

  1. 模型文件是不是 .safetensors.ckpt
  2. 文件是否放在 ComfyUI/models/checkpoints/,Desktop 用户则看软件打开的 models folder。
  3. 移动文件后是否刷新或重启了 ComfyUI。

如果你用了 extra_model_paths.yaml,先把配置简化到只有一个路径,确认路径能读到,再慢慢扩展。路径里有中文、空格、权限限制时,也可能引入额外问题。

打开 workflow 后出现红色节点

红色节点通常表示缺少 custom node、缺少模型,或 workflow 版本与你当前环境不匹配。新手不要从复杂 workflow 开始排查。先回到默认文生图 workflow,确认基础链路可用。

如果默认 workflow 正常,再处理 shared workflow:

  • 先看红色节点的名字,判断缺哪个 custom node。
  • 再看模型加载节点,确认 checkpoint、LoRA、VAE 是否都能找到。
  • 最后再处理节点参数,不要一开始就乱改连线。

这一步适合放到第二天学习。第一天先别让 custom nodes 把你带偏。

CUDA、Torch 或后端报错

这类报错通常不是 prompt 的问题,而是运行环境不匹配。Windows 用户优先确认显卡驱动和安装包路线;Linux 用户再按手动安装文档核查 Python、PyTorch 和后端;macOS 用户不要套用 CUDA 教程。

如果你不想花时间处理环境,先用 Desktop 或 cloud 跑通概念。等你确定要长期本地使用,再回头解决显卡和后端细节。

图片很糊,或者完全不像提示词

先不要怀疑 ComfyUI 坏了。常见原因有四个:

  • 模型不适合当前画面类型。
  • prompt 太抽象,没有主体、场景、光线、风格。
  • 尺寸或采样参数被改得太激进。
  • 负向 prompt 把模型限制得太死。

建议你固定模型和参数,只改 prompt 做三轮对比。比如第一轮只写主体,第二轮加场景,第三轮加光线和风格。这样你会更容易看出 prompt 对结果的影响。

新手不要一开始做什么

ComfyUI 很强,但新手最容易被“强”拖慢。

第一,不要一开始就安装几十个 custom nodes。节点越多,冲突和缺依赖的概率越高。等默认 workflow 能稳定跑,再按某个具体需求安装。

第二,不要同时下载十几个模型。先选一个基础模型跑通,记录它适合什么风格,再逐步增加。模型太多会让你分不清是 prompt 问题还是模型问题。

第三,不要急着研究 API 自动化。ComfyUI 的 API 很有用,但如果你还没理解 workflow,自动化只会把错误批量放大。

第四,不要把别人的 workflow 当成标准答案。很多分享出来的 workflow 依赖特定模型、节点版本和路径。你可以学习结构,但不要期待复制后马上可用。

建议学习顺序

更稳的路线是:

  1. 跑通默认文生图 workflow。
  2. 理解 checkpoint、LoRA、VAE 的区别。
  3. 学会看 workflow JSON,知道红色节点代表什么。
  4. 学一个具体增强方向,比如 ControlNet 或 IP-Adapter。
  5. 再研究批量出图、API、自动化和工作流复用。

如果你熟悉本地 LLM,可以把 ComfyUI 类比成本地图像生成的推理工作台。你可以先读 Ollama 入门:本地运行大语言模型的第一步,理解模型文件、运行环境和推理参数之间的关系;Prompt 写法可以接着看 Prompt Engineering 商业实战;显卡和运行环境问题可以参考 Ollama GPU 加速配置

总结

ComfyUI 入门不需要从复杂工作流开始。你先把目标压到很小:选一条适合自己的安装路线,把基础模型放到正确目录,用默认文生图 workflow 跑出第一张图片。

等这条链路跑通,再学 LoRA、ControlNet、自定义节点和工作流复用。这样每一步都有清楚的判断标准:模型有没有读到,节点有没有缺失,prompt 有没有具体,输出有没有保存。ComfyUI 的学习曲线确实陡,但只要第一天不把所有东西混在一起,它会从一张吓人的节点图,变成一套可以反复调试的生成流程。

参考资料

常见问题

ComfyUI 新手应该选 Desktop、portable 还是手动安装?
只想快速跑出第一张图,优先选 Desktop 或 Windows portable;如果你用 Linux,或需要自己控制 Python、PyTorch、CUDA/ROCm/MPS 后端,再考虑手动安装。
ComfyUI 模型应该放在哪个目录?
基础 checkpoint 通常放在 ComfyUI/models/checkpoints/;LoRA 放在 models/loras/;VAE 放在 models/vae/;embedding 放在 models/embeddings/。Desktop 用户应以软件打开的 models folder 为准。
为什么 ComfyUI 的 Load Checkpoint 是空的或 null?
优先检查模型文件格式、目录位置和刷新/重启。多数安装不会自带基础模型,如果模型没有放进 checkpoints 目录,ComfyUI 就读不到。
打开别人分享的 workflow 出现红色节点怎么办?
红色节点通常表示缺少 custom node、缺少模型,或 workflow 与当前环境不匹配。新手应先回到默认文生图 workflow,确认基础链路跑通,再处理 shared workflow。
第一张图不好看是不是安装失败?
不一定。第一张图的目标是验证环境、模型和 workflow 连通。图片很糊或不像提示词,通常要从模型选择、prompt 具体程度、尺寸、采样参数和负向 prompt 排查。

11 分钟阅读 · 发布于: 2026年6月1日 · 修改于: 2026年6月2日

评论

使用 GitHub 账号登录后即可评论