ComfyUI入门:用AI生成你的第一张图片

admin 📖 9 分钟阅读 💬 0 条评论

最近身边越来越多朋友问我,怎么用AI画图。说实话,我第一次接触AI生图的时候也是一脸懵。试了Midjourney,试了Stable Diffusion WebUI,兜兜转转最后发现ComfyUI才是最适合我的工具。今天就来好好聊聊ComfyUI这个东西,从零开始,带你生成你的第一张AI图片。

ComfyUI到底是什么

简单说,ComfyUI是一个基于节点的Stable Diffusion图形化前端。什么意思呢?就是它不像WebUI那样给你一堆按钮和输入框,而是把整个生图过程拆成一个个小模块——我们叫它"节点"——然后你把这些节点用线连起来,形成一条完整的工作流。

这种设计最大的好处是灵活。你可以非常精确地控制图片生成的每一步:用什么模型、什么采样器、怎么设置步数、要不要用ControlNet控制构图、怎么放大细节。缺点嘛,就是上手曲线比WebUI陡一些,刚开始看到满屏的连线和密密麻麻的参数确实会有点慌。

我自己用了大概一周才真正上手,但一旦理解了节点逻辑,就再也回不去WebUI了。因为你会发现,以前在WebUI里很多做不到的事情,在ComfyUI里只需要多连一个节点就能搞定。

安装ComfyUI

安装其实比你想的简单很多。官方给了一个一键包,Windows用户直接下载解压就能用。如果你用的是Linux或者Mac,就需要手动装一些依赖,但也不算太复杂。

Windows用户(推荐直接用一键包):

去ComfyUI的GitHub仓库(github.com/comfyanonymous/ComfyUI),找到Releases页面,下载最新的一键包。解压后双击run_nvidia_gpu.bat,等一会儿,浏览器会自动打开一个页面,就是ComfyUI的操作界面了。整个过程大概五分钟就能搞定。

手动安装的话:

  1. 确保你的Python版本是3.10或3.11,太新的版本有些库还不兼容
  2. 克隆仓库:git clone https://github.com/comfyanonymous/ComfyUI
  3. 进入目录后,安装PyTorch(选你显卡对应的CUDA版本)
  4. pip install -r requirements.txt
  5. 运行python main.py

几个重要的注意事项:

显卡至少需要4GB显存,推荐8GB以上。N卡(NVIDIA)基本没问题,开箱即用。A卡(AMD)需要额外折腾一下ROCm,不太推荐新手尝试。Mac用户用M系列芯片也可以跑,但速度会比N卡慢不少。我一开始用的是6GB显存的1660Ti,跑SD1.5的模型完全没问题,但上SDXL就比较吃力了,生成一张图要等挺久。

另外,模型文件要放在ComfyUI/models/checkpoints目录下,这点别搞错了,很多人装好之后发现加载不了模型,就是路径放错了。

理解工作流的核心概念

ComfyUI的精髓就是"工作流"(Workflow)。我第一次打开界面的时候,里面已经有一个默认的生图工作流。你可以把它理解为一条流水线:原材料进去,经过一系列加工处理,成品图片从另一端出来。

一条最基础的工作流通常包含这几个核心节点:

  • 加载模型(Load Checkpoint):选择你用的AI模型,这是整条流水线的起点
  • 正向提示词(CLIP Text Encode):告诉AI你想要什么样的画面,比如"一个女孩在海边"
  • 反向提示词(CLIP Text Encode):告诉AI你不想要什么,比如"模糊、低质量、变形"
  • 空的潜在图像(Empty Latent Image):设定图片的初始尺寸
  • 采样器(KSampler):这是控制生成过程的核心参数,决定了AI如何一步步画出图片
  • 解码器(VAE Decode):把AI内部的数学表示转成人眼能看的图片
  • 保存图片(Save Image):把结果保存到硬盘上

这些节点之间用线连起来,数据就像水流一样从左往右流过每个节点,最后输出一张图片。每个节点只负责一件事,但组合起来就能完成复杂的生图任务。

我建议你第一次用的时候,先不要急着改任何东西,直接用默认工作流跑一遍,看看效果。这样你对整个流程会有一个直观的感受。等你看到图片生成出来之后,再尝试修改提示词,观察变化,这样学习效率最高。

生成你的第一张图片

好,现在来实际操作一下,跟着我一步步来。

  1. 打开ComfyUI界面
  2. 你看到的默认工作流里应该已经加载了一个模型,如果没有,点击"加载模型"节点的下拉框,选一个你下载好的模型文件
  3. 找到正向提示词的节点,在文本框里输入你想画的内容,比如:a cute cat sitting on a windowsill, sunlight, detailed fur, anime style, masterpiece
  4. 反向提示词可以填:blurry, low quality, deformed, bad anatomy, extra fingers
  5. 点击右侧的"Queue Prompt"按钮(就是排队执行的意思)
  6. 等待进度条走完,你的图片就生成了

第一次看到自己用AI画出来的图,那种感觉还挺奇妙的。虽然可能效果一般,但确实是自己一步步操作出来的。如果结果不满意,别灰心,调整一下提示词再试,AI生图本身就是一个反复试验的过程。

常用模型推荐

模型是AI生图的灵魂。不同的模型擅长不同的风格,选对模型比调参重要得多。

Stable Diffusion 1.5(SD1.5)

这是最经典的老牌模型,资源多、插件丰富、跑得快,显卡要求低。很多人的入门选择就是它。缺点是画质上限不算高,细节处理一般,分辨率也比较低。但如果你显卡不够好,SD1.5依然是最稳妥的选择。

SDXL(Stable Diffusion XL)

SD1.5的全面升级版,画质有质的飞跃。默认支持1024x1024的分辨率,细节、光影、构图、色彩都好了一个档次。我现在日常用得最多的就是SDXL。不过对显存要求也更高,8GB显存是最低门槛,12GB以上体验会好很多。推荐去CivitAI下载社区微调过的版本,效果比官方原版更好。

Flux

最近比较火的新模型,由Black Forest Labs出品。Flux最大的特点是对提示词的理解能力非常强,基本上你写什么它就能画什么,不像早期模型经常"不听话"或者自作主张。画质也非常出色,尤其是真实感方面表现突出。缺点是模型文件比较大,推理速度稍慢,对显存要求也比较高。推荐在Hugging Face上下载官方的Flux.1-dev版本,想要速度快一些可以试试量化后的版本。

我自己的建议: 如果你的显卡是8GB以上,直接上SDXL或者Flux,画质完全不在一个级别。如果显卡一般,从SD1.5开始也没问题,先把工作流搞明白、把提示词写熟练,后面换模型就是换个文件的事。

新手实用技巧

提示词怎么写才有效果?

不需要写很长很复杂的句子。英文效果通常比中文好很多,因为模型主要是在英文数据上训练的。结构大致是:主体描述 + 环境氛围 + 画风风格 + 质量标签。比如1girl, flower garden, golden hour lighting, detailed illustration, best quality。不用死记硬背,多去CivitAI看别人的作品和对应的提示词,慢慢就有感觉了。

采样器和步数怎么选?

采样器推荐新手先用dpmpp_2m或者euler_ancestral,这两种比较通用,出图稳定。步数设20到30步就够了。步数太少图会糊,太多则浪费时间而且提升非常有限。CFG Scale一般设7到8,太高会导致画面过饱和、颜色失真。

图片尺寸怎么定?

SD1.5推荐512x512或者512x768,SDXL推荐1024x1024或者1024x768。尺寸设错容易出问题,比如人物多出来几根手指、构图混乱、出现奇怪的重复图案。这些其实是模型的训练分辨率决定的,别硬撑着用不合适的尺寸。

ComfyUI Manager是必备工具

社区里有大量优秀的自定义节点,比如ControlNet(精确控制人物姿势和构图)、LoRA加载器(微调特定风格或角色)、图像放大节点(提升画质)、局部重绘(只修改图片的某个区域)等等。安装这些自定义节点的时候,ComfyUI Manager这个插件是必备的,它能让你一键搜索和安装各种社区节点,省去了手动下载和配置的麻烦。强烈推荐在安装好ComfyUI后第一时间装上它。

多用别人的工作流

ComfyUI的一大优势就是工作流可以导出分享。你可以在CivitAI、OpenArt或者GitHub上找到别人分享的工作流,直接把工作流图片拖进ComfyUI就能加载和使用。这是学习最快的方式,看看别人的作品用的是什么节点、怎么连的、参数怎么设的,慢慢你就理解了每个节点的真正作用。我到现在还会经常去看别人的工作流来学习新的技巧。

善用图像放大和修复

很多时候AI直接生成的图片分辨率不够用。这时候可以先用基础工作流生成一张小图,然后再用放大节点(比如Hires Fix或者Ultimate SD Upscale)来提升分辨率和细节。这个两步走的策略比直接生成大图要高效得多,而且效果往往更好。

写在最后

ComfyUI的学习曲线确实比一些一键出图的工具要陡一些,但它的上限也高得多。当你真正理解了节点逻辑之后,你几乎可以实现任何你想要的生图效果。而且社区非常活跃,每天都有新的节点和工作流出现,这个工具还在快速进化中。

我的建议是,别怕折腾,也别急着一步到位。多试、多看、多调。AI生图本身就是一个不断试错和探索的过程,每一次尝试都在积累经验。等哪天你回头看自己最开始生成的那些图,再对比现在的作品,你会惊讶于自己的进步。

希望这篇文章能帮你顺利迈出AI生图的第一步。

本文内容由AI辅助整理生成,仅供参考。

🤖 本文内容由AI辅助整理生成,仅供参考
← 上一篇 5款AI写作工具实测对比,哪个最好用? 下一篇 → AI编程助手大比拼:Copilot、Cursor、DeepSeek谁更香?

💬 发表评论