AI

ComfyUI 图生图怎么搭?其实比文生图就多俩节点,关键是那个滑块

AI智能摘要
ComfyUI 图生图工作流仅需替换文生图中的空白节点为 Load Image 与 VAE Encode,核心差异在于 KSampler 的 denoise 参数。该值控制噪声融入比例:0.35 保留构图微调细节,0.5 实现风格转换,建议从 0.4 起步小步调整。新手需警惕显存溢出、VAE 缺失致发灰及提示词未适配原图三大误区,掌握此逻辑即可通用于风格迁移与局部重绘。
— 此摘要由AI分析文章内容生成,仅供参考。

  会了文生图(给词出图),很多人卡在图生图(img2img)上,觉得又得重学一套。真没那么玄。图生图的工作流跟文生图九成是一样的,核心只换了两个节点、多调一个参数。 今天把这条线从头串一遍,你照着搭一次就明白了。

先想明白图生图在干嘛

  文生图是从一团纯随机噪声开始擦出图;图生图是先把你给的那张图揉进一点噪声,再擦回来。揉进去多少噪声,决定了最后这张图离原图有多远——这就是后面要反复说的那个滑块。理解了这点,节点怎么连就顺理成章了。

这条数据流,记住它

  文生图的链路你应该眼熟:Load Checkpoint(载入大模型)→ CLIP Text Encode(写正负提示词)→ Empty Latent Image(造一张空白噪声)→ KSampler(采样)→ VAE Decode(解码回图)→ Save Image。

  图生图只动中间那一截。把 Empty Latent Image 这个节点删掉,换成两个:

  • Load Image:载入你要改的那张原图。
  • VAE Encode:把这张图”翻译”成潜空间能看懂的数据,再喂给 KSampler。

  为啥要 VAE Encode?因为你 Load 进来的是普通像素图,KSampler 在潜空间里干活,看不懂像素,得有个编码器把图翻译过去。这一步是图生图区别于文生图的关键动作,漏接它整条流程就跑不通

  所以新的链路是:Load Image → VAE Encode →(接到 KSampler 的 latent 入口)→ KSampler → VAE Decode → Save Image。Checkpoint、CLIP 那几个照旧连,提示词照常写。就这点改动,没了。

真正的旋钮:KSampler 里的 denoise

  节点连对只是及格,图生图的灵魂在 KSampler 里那个 denoise(重绘幅度),范围 0 到 1,它管的就是”往原图里揉多少噪声”。这个值怎么给,直接决定成败:

  • denoise = 0:等于没改,原图直接吐出来。
  • denoise = 1:噪声几乎加满,原图基本没了,跟文生图没区别。
  • 0.35 左右:想保住原图构图、只改改质感细节,用这档,画面骨架基本不动。
  • 0.5 左右:做风格转换(比如照片转插画)的常用值,既换了味道又留得住大致样子。

  我的建议是从 0.4、0.5 起步,小步试:嫌它改太狠就往下调,嫌它没动静就往上加,一次动 0.05–0.1,别一把从 0.3 跳到 0.8,那基本是两张不相干的图,你都不知道是哪一步起的作用。

几个新手最容易栽的坑

  第一,出来一张糊图或者变化离谱:多半是 denoise 给太高了,先把它压回 0.4 看看。

  第二,VAE 没接好导致图发灰发白:如果你的大模型自带 VAE 没问题,但有些模型得单独载入 VAE(用 Load VAE 节点接到 VAE Encode 和 VAE Decode 上),不然颜色会发灰发闷,这点跟文生图一样要注意。

  第三,原图尺寸和出图尺寸对不上:图生图是按原图的潜空间尺寸来的,如果你原图很大,显存可能直接爆。可以先在 Load Image 后面加个缩放节点把图改到合适大小,或者干脆喂一张分辨率正常的图。

  第四,提示词别忘了改:很多人换了原图却还用着上次那套词,结果模型一边想听你的词、一边想保留原图,打架出来个四不像。图生图的提示词最好描述你想要的结果,而不是原图本来的样子。

串起来再说一遍

  Load Image 载图 → VAE Encode 翻译进潜空间 → KSampler 里用 denoise 控制改多少 → VAE Decode 解码 → 保存。Checkpoint 和提示词照搬文生图那套。整个图生图,你真正要拿捏的就一个 denoise。 把它从 0.4 开始一档一档试熟了,什么风格迁移、局部翻新、老图重绘,基本都是这套流程的变体。先搭通,再玩花的。

暂无介绍....

登录用户才能发表评论! 登录账户

取消回复

评论列表 (0条):

加载更多评论 Loading...

延伸阅读:

暂无内容!

    返回顶部