打印

[原创] 浅谈一下AI出图的一些提示词思考逻辑。（纯技术讨论，无图）

joker1204

LEVEL 5

Rank: 4

UID: 1725839
帖子: 730
积分: 35
金币: 1552 枚
威望: 0 点
金镑: 0 个
银币: 332 枚
注册时间: 2008-8-5
最后登录: 2024-5-17

1楼大中小发表于 2024-1-12 06:36 只看该作者

4

浅谈一下AI出图的一些提示词思考逻辑。（纯技术讨论，无图）

版主留言

嗨嗨妹(2024-1-12 12:56)提示: 请勿连楼发布内容，自己的帖子尽量在一起完成。

希望点进这个帖子的基本都是能配置SD，会下插件的大佬们。
本区目前出图仍旧属于入门者居多，从这区建立开始看到现在，没几张在涩情和艺术层面能惊艳到人的图。
（甚至连值得保存收藏的渋图也没几张，能留下印象的只有那个用majic生成恐怖照片的老哥）。

这里简单说下如何能出一张好图的流程
首先确定自己想出什么图，搞清楚自己需要表达什么，
呈现出的事物里什么是主体什么是次要什么是点缀。
这一点其实和写作文一样。

1.比如我想生成一个美国队长被米清糊脸的图，
问题来了，米清多少合适？
米清多了，脸被盖太多，美队辨识度就低了，米清淡了又无法达使观众满足。
所以一般情况下，脸上挂糊少许，头发挂糊少许，尽量让面部挂糊范围少于20%，提高挂糊的透明度，在挂糊的同时，提高人物面部的表现度。

2.
我们想出什么样的图，是3D还是仿真写实照片，还是2D图还是2.5D，还是连噪点都要模仿出来的amateur图？
这个区常见的特点就是AI图片主题不够明确，以至于出的图看似真人但是AI感强烈，看似仿照片但是太过油腻，拉低观感。

所以弄清楚自己想出什么图之后，
就可以输入 RAW photo（写实照片),UE5（虚幻引擎，用于CG图），3D(类似FF7和DOA的游戏3D角色)，2D(二次元卡通)
比如写实类的，如果需要加深写实质感，那么可以下载一些比如拍立得系列，黑白调系列，照片噪点系列，慵懒系列，电影胶片系列的滤镜增加图片质感。
假如需要出类似完美世界那种2.5D图，只需要输入3D,ue5,这类提示词就可以达到良好效果，其他就是使用角色lora之类的
2D的比较普及，只需要使用原始2D类似血橙万物熔炉，饺子混合，ghostmix这类模型即可，想要生成人物可以用人物lora，想要画风可以加入画风lora。
归根结底也就一句话，当你想写作文的时候，你至少得确认你写的是作文而不是诗歌。

在使用lora的时候，一般情况下服装，具有显著人物色块构成的要素是可以2d，3d，2.5d混合使用，因为他们的逻辑始终都是先出色块，再出结构，最后出质感。
所以滤镜，画风这类lora是无法通用的，而动作姿势，道具这些一般情况下只要大模型能辨识，那么就能使用。

至于图像质感增加的要素，除了提示词的准确描述，还有一些类似细节增加的lora也能用。可以增加服装皱褶，地面细节，甚至布料和金属的质感纹理等等。

归根结底大家需要明白AI并不是万能的“”它无法生成没有人教过他的东西“”
所有原生大模型都是基于输入提示词和画面对应之后进行深度学习才能生图，假如大模型没有学习“”空中飞人“” 这类词汇，那么你提示词输入空中飞人也没用。
所以这里还是建议大家多储备模型，多加体验。

以上都是一些基于生图逻辑的经验。
其实真想要生成一张好图，
我个人还是建议诸位去C站，libi这类网站找大佬们生成的图保存之后用sd反推提示词
反推提示词之后保存提示词组，下次直接调用。

比如上面说的那些乱七八糟改善质量，提高出图精细度的通用提示词可以直接存一个当起手式用。
（大师作品），（最高质量）,(详细表达),(丰富细节)这类。
总而言之...抄大佬作业始终是最快出好图的做法。
至于自己想要创新制作的东西，那都是学会炼丹后的操作了。

[ 本帖最后由 joker1204 于 2024-1-12 06:58(GMT+8) 编辑 ]

附件: 您所在的用户组无法下载或查看附件

本帖最近评分记录

嗨嗨妹金币 +50 感谢分享，论坛有您更精彩！ 2024-1-12 12:55

TOP

作者的其他主题:
浅谈一下AI出图的一些提示词思考逻辑。（纯技术讨论，无图）一些使用AI的经验，无图，新人创作者可以过来看看。业余猜测一下巴以目前的状况以及一些感想，不涉立场，只谈分析,理性讨论，魔怔勿入。终究还是没能熬过去，瓦格纳系列终章战争如戏，全是演技，瓦格纳跳反吃瓜系列之3 乐子连续剧之瓦格纳的跳反——（2）

joker1204

LEVEL 5

Rank: 4

UID: 1725839
帖子: 730
积分: 35
金币: 1552 枚
威望: 0 点
金镑: 0 个
银币: 332 枚
注册时间: 2008-8-5
最后登录: 2024-5-17

2楼大中小发表于 2024-1-12 07:33 只看该作者

0

best quality,masterpiece,,1girl,(8kRAW photo:1.2),beautful,正提示epiCPhoto:1,Ultra-realistic 8k CG,masterpiece,best quality,(photorealistic:1.4),HDR,absurdres,Professional,RAW photo,lens flare,(film grain:1.1),Bokeh,((Depth of field)),raytracing,sunlight,(wind:1.2),1girl,((hair between eyes)),(hair over eyes:1.1),eyes covered by hair,long hair,expressionless,asymmetrical bangs,upper body,disheveled hair,looking at viewer,solo,sexy,seductive smile,(school uniform:1.2),mini skirt,large_breasts,Dusk,white shirt open,on the beach,<lora:修细节add_detail:0.35>,<lora:InstantPhotoX3:0.3>,<lora:v3FilmVelvia3:0.3>,realistic vintage photo style,(polaroid:1.1),,(EOS R8,50mm,F1.2,8K,RAW photo:1.2),(full body:1.3),pantiesinskirt,(huge breasts, ),tight tits,white thighhighs,white legwear,

=========================================
(EasyNegative:1.2),(worst quality:2),(low quality:2),(normal quality:1.6),(ng_deepnegative_v1_75t),monochrome,(watermark:1.4),artist name,(character name:1.2),text,bad anatomy,sketch,duplicate,(negative_hand-neg:1.2),bad_pictures,FastNegativeV2,BadDream:1,负面提示词epiCPhoto-neg:1,lowres blurry image with compressed jpeg artifacts,bad-hands-5,EasyNegative,

[ 本帖最后由 joker1204 于 2024-1-12 07:34(GMT+8) 编辑 ]

附件: 您所在的用户组无法下载或查看附件

TOP

joker1204

LEVEL 5

Rank: 4

UID: 1725839
帖子: 730
积分: 35
金币: 1552 枚
威望: 0 点
金镑: 0 个
银币: 332 枚
注册时间: 2008-8-5
最后登录: 2024-5-17

3楼大中小发表于 2024-1-12 08:02 只看该作者

0

一张合格的AI生成图，不仅在于角色主体的塑造是否合格。
还得考虑背景，透视，光源的关系，讲真，这些都有些随机了
能够满足要求的大模型少得可怜。
绝大多数的大模型都是交给人工智能自己打tag的，所以辨识度只能随缘，
所以虽然我们要做的都是尽量精简提示词，但是实际操作中，往往输入多个同意思的提示词先出图，
然后删除掉无效的提示词碰运气，有用则留，无用则删。

[ 本帖最后由 joker1204 于 2024-1-12 08:05(GMT+8) 编辑 ]

附件: 您所在的用户组无法下载或查看附件

TOP

joker1204

LEVEL 5

Rank: 4

UID: 1725839
帖子: 730
积分: 35
金币: 1552 枚
威望: 0 点
金镑: 0 个
银币: 332 枚
注册时间: 2008-8-5
最后登录: 2024-5-17

4楼大中小发表于 2024-1-12 08:26 只看该作者

0

以出写实图为例，
出图的要素除了上述的各种
在生成人物的时候，始终得想办法让图片“”活“”起来
体现这些最基本的要素就是头发，姿势，眼神，表情等等
更深一些就是皮肤毛孔，些微的皱纹瑕疵皮肤斑点，甚至毛细血管，眼角皮肤皱褶。
这些都是可以通过制作lora打tag的去实现
只有在这些地方都做的尽善尽美之后，才能去掉图片带来的AI感。
我发的这4张图有没有注意到面部表情的细微差距？
这区里有个朋友发了一套图，大概几十张吧。
表情近乎都是同一个，看多了就有些渗人了。
而我发的这4个图，都是基于原图的面部微表情进行了打tag
比如看着镜头，咧嘴笑，自信，高傲，轻松，眼神锐利等等。

[ 本帖最后由 joker1204 于 2024-1-12 08:37(GMT+8) 编辑 ]

附件: 您所在的用户组无法下载或查看附件

TOP

joker1204

LEVEL 5

Rank: 4

UID: 1725839
帖子: 730
积分: 35
金币: 1552 枚
威望: 0 点
金镑: 0 个
银币: 332 枚
注册时间: 2008-8-5
最后登录: 2024-5-17

5楼大中小发表于 2024-1-12 08:35 只看该作者

0

AI生图的时候，最大的难点就在于如何让肢体不出错。
这一点在2023年7月之前很难做到
因为早期大模型都是用的512生的图，
而后4070系以上的显卡进入战斗之后，大模型的素材就进入了768*768，甚至1024*1024的阶段
举个例子，512*512的全身图看不出手部细节，但是1024*1024就能分出5个手指。
所以越是晚出的大模型理论上就越精细，出现肢体错误的可能性就越低。
这一点在下载大模型的时候需要看他的素材参数。
大模型用512的，近乎可以断言它的肢体烂，无法妥善出全身图。细节少，画面无法做到丰富。
但是手指这些毕竟不如面部的辨识度高，再好的模型也会有30%左右崩手概率
所以只能依靠身体遮挡，裙摆遮住一部分，或者藏在身后，或者拿着背包，握着拳头去规避。
甚至可以选择单独做一个拿着物件的lora去应付手指警察。

TOP

joker1204

LEVEL 5

Rank: 4

UID: 1725839
帖子: 730
积分: 35
金币: 1552 枚
威望: 0 点
金镑: 0 个
银币: 332 枚
注册时间: 2008-8-5
最后登录: 2024-5-17

6楼大中小发表于 2024-1-12 08:53 只看该作者

0

还是拿我上面几张图举例
提示词都是同样的，但是很明显，我的sexy这个提示词明显没有用，是可以去掉的
但是校服，迷你裙，白体恤衫这几个是辨识度极高的，近乎做到了百分百辨识度
什么意思呢？
就是说这个大模型里，上述辨识度高的服装特征至少训练了几百上千次，以至于一听就懂
而sexy这个词，这么解释吧，AI无法理解一个穿着校服外套，白体恤衫，穿着迷你裙的JK怎么样才能性感起来。。。
因为AI对sexy的理解很直白的就是裸露，而我上述提示词里，并没有衣着暴露的相关词汇。
所以在我构思的这个图里，sexy就是无效词汇。
至于我如何能在不改变整体构图的情况下，让图hot起来？
那么大可以加入透视，紧身，凸点，骆驼趾，提起裙子露出内裤，破烂的丝袜这类提示词，以便AI做出具体姿势，凸显想要的衣物特征。
必要时，还需要配合相应的lora去实现。

TOP

mazungpa

LEVEL 1

UID: 13290848
帖子: 2
积分: 1
金币: 50 枚
威望: 0 点
金镑: 0 个
银币: 2 枚
注册时间: 2022-1-27
最后登录: 2024-1-12

7楼大中小发表于 2024-1-12 10:01 只看该作者

0

很实用的教程，已收藏，慢慢学习

TOP

joker1204

LEVEL 5

Rank: 4

UID: 1725839
帖子: 730
积分: 35
金币: 1552 枚
威望: 0 点
金镑: 0 个
银币: 332 枚
注册时间: 2008-8-5
最后登录: 2024-5-17

8楼大中小发表于 2024-1-12 10:55 只看该作者

0

ADetailer
这个插件挺好用，在修改面部以及其他身体特征地方的时候可以放大重绘不影响整体观感
于是可以在生成身体部位大图之后，进行局部面部重绘。
最新版本有一个重绘使用独立模型的功能，
也解决了lora在不同模型下的泛化性问题。
使用A大模型下炼制的tifa角色lora生成tifa身体特征的同时，使用插件让B大模型下炼制的面部制作一个热爱cos的shaito A小姐。
从而让B模型的脸契合A模型。
因为tifa脸型是瓜子脸，而A小姐是是偏圆脸，且较短，于是lora权重给的0.45，像，但不是完全像。
虽然给到0.6会更像，但是会带来一些过拟合的现象。
所以面部还原，一般给到0.5即可，剩下的可以让AI自行修补。
现实中的人脸多少都会有瑕疵，AI可以通过拓补和面部修复将其面部的缺陷稍微修复，最后只要是成功生成的图像，多少都会比真人更好看一点。
但是缺点就是会失去原本的辨识度，更加接近网红脸。
这里发的几张其实仍旧有CG感，其主要是因为原始的数据集基本都是拿后期处理过的图进行学习，所以也会把高清图像经过处理后的特征学进去。
当然解决办法不是没有，需要从炼制lora的时候使用最原始的raw photo素材进行炼丹。
可以做，但是近乎没有必要。

[ 本帖最后由 joker1204 于 2024-1-12 11:22(GMT+8) 编辑 ]

附件: 您所在的用户组无法下载或查看附件

TOP

joker1204

LEVEL 5

Rank: 4

UID: 1725839
帖子: 730
积分: 35
金币: 1552 枚
威望: 0 点
金镑: 0 个
银币: 332 枚
注册时间: 2008-8-5
最后登录: 2024-5-17

9楼大中小发表于 2024-1-12 11:26 只看该作者

0

总结语，
我也不是彻底闲着没事干去写这攻略贴。
主要目的就是因为我这人懒，自己做渋图还得想怎么渋才能渋到我
但是这里的老哥又勤奋xp又千奇百怪
所以写一点出图逻辑层面和优化出图的攻略发在这里
以后就有无穷无尽的高质量渋图可以白嫖了。老哥们，如果觉得有被帮到就发图渋一下我吧

[ 本帖最后由 joker1204 于 2024-1-12 11:28(GMT+8) 编辑 ]

TOP

csjr

LEVEL 3

Rank: 2

UID: 73248
帖子: 375
积分: 16
金币: 796 枚
威望: 0 点
金镑: 0 个
银币: 46 枚
注册时间: 2005-11-15
最后登录: 2024-5-19

10楼 大中小发表于 2024-1-12 18:38 只看该作者

0

大师常用的软件是哪一款也想学

TOP