很多人刚玩 Stable Diffusion 都有同一个困惑:明明把想要的东西都写进去了,出来的图就是跟你对着干——要的红裙子变成红头发,想要的人站着结果坐下了,背景里该有的窗户死活不出现。
这事儿八成不是模型笨,是你的提示词写法没对上它的脾气。提示词(Prompt)说白了就是你给 AI 下的菜单,但这个厨子读菜单的方式跟人不一样。今天就把新手最该先掌握的几条规矩讲清楚,照着调,出图听话率立马上一个台阶。
第一条:越靠前的词,分量越重
SD 读提示词是有先后讲究的。越往前的词,它越当回事;排在后面的,越容易被它当成”随便参考一下”。
所以写词的顺序应该是:先写画面主体和最关键的特征,再写风格、光线、背景这些次要的。比如你想要”一个穿红裙子的女孩站在海边”,别一上来先堆一大串”高质量、电影感、8k、大师作品”再说人——那样模型很可能把精力都花在画质上,主体反而糊弄过去。正确的顺序是先把”a girl, red dress, standing, beach”这种核心信息顶到最前面,质量词、风格词放后面。
还有个容易被忽略的点:提示词不是越多越好。模型对提示词有个长度上的处理机制,大致每 75 个 token(可以粗略理解成 75 个英文单词)算一组,塞太多,后面的词基本就被稀释得没声音了。所以新手别一口气写两百个词,挑真正要紧的几十个,效果反而更稳。
第二条:权重,用括号去”喊话”
如果某个东西模型总是画不够,或者画太过,你可以用括号给它调音量。
在 WebUI 里最常用、也最直观的是这种写法:(red dress:1.3)。冒号后面的数字就是权重,1 是默认,大于 1 是加强,小于 1 是减弱。1.3 的意思就是”这个词我要你多上点心”。想压低某个元素,就写成 (something:0.7) 这种。
也有老式的纯括号写法:每套一层小括号 () 权重大约 ×1.1,每套一层中括号 [] 大约 ×0.9。不过这种数括号的方式现在没人爱用了,直接写 :数字 更清楚也更好改。
这里要劝一句:别一激动就拉到 1.8、2.0。权重给太狠,画面会开始变形、出油画感、颜色糊成一团,这就是所谓的”烤糊了”。实战里绝大多数情况 1.2 到 1.4 就够用,真不行再小步往上加,一次加 0.1,边加边看。
第三条:负面词,留几个管用的就行
负面提示词(Negative Prompt)是告诉模型”这些东西别给我画”。新手最常犯的毛病,是从网上抄一长串几十个词的负面模板,以为越长越保险。其实没必要,堆太多反而会拖累画质,有时候还会把你想要的细节一起干掉。
真正常用、也确实管用的就那么几个:画质类的 lowres, blurry, worst quality,人物类的 bad hands, bad anatomy, extra fingers。先用这一小撮打底,等你发现某张图具体哪里翻车了——比如老是多根手指、老是水印——再往负面里针对性地补一两个词,这才是高效的做法。负面词同样能加权重,比如手老画崩,写 (bad hands:1.2) 去压它。
一个能照着走的排查顺序
如果你写了半天图还是不对,别瞎改,按这个顺序捋:
先看主体词是不是排在最前面、有没有被一堆质量词挤到后面去;再看关键元素的权重够不够,不够就给它套个 :1.3;然后检查负面词是不是堆太多、误伤了主体;最后才去动采样器、步数那些参数。很多人一上来就猛调参数,其实问题就出在提示词的顺序和权重上,白折腾。
提示词这东西没有标准答案,同一个想法十个人能写出十种写法。但语序靠前、权重适度、负面精简这三条,是几乎所有听话的图共有的底子。先把这三条变成肌肉记忆,你会发现 SD 突然就没那么犟了。

评论列表 (0条):
加载更多评论 Loading...