当看到一张图片特别棒,想复制它的风格,或者在保留某些元素的基础上重新绘制,却不知如何向AI传达你的想法?试试反推提示词!
在AI绘画中,提示词就是创作的“指南针”。今天,我来分享几种实用的图片反推提示词方法,如果你还在为写不出有效的提示词而苦恼,就快来看看吧!
一、人工手搓
最基础的反推方法就是自己写。根据图片内容,凭借自己的理解去手动编写提示词。我总结了一个写提示词的公式,大家可以参考一下:
人物/主体特征+场景特点+画幅视角+画质优化+艺术风格
①人物/主体特征:服饰穿搭、发型发色、五官特点、面部表情、肢体动作等。
②场景特点:地理环境(室内、室外、森林、街道等)、光照特点(白天黑夜、日出日落、明亮昏暗等)。
③画幅视角:距离、人物比例、观察视角、镜头类型等。
④画质优化通用提示词模版:
正面:
(masterpiece:1,2),best quality,masterpiece,highres,original,extremely detailed wallpaper, perfect lighting,(extremely detailed CG:1.2), drawing, paintbrush
负面:
worst quality,low quality,normal quality,lowres,normal quality, monochrome,grayscale,skin spots,acnes,skin blemishes,age spot, ugly,duplicate,morbid,mutilated,tranny:1.331, mutated hands,poorly drawn hands:, blurry,bad anatomy,bad proportions,extra limbs,disfigured,missing arms,extra legs,fused fingers,too many fingers,unclear eyes, lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers, extra arms and legs
⑤艺术风格:插画风、写实风、二次元、中国风、赛博朋克等,以及你想要模仿的艺术家风格名称。
以这张图片为例,我写了这段提示词:
“照片中间,一位20岁的亚洲女子站在岩石上,手里拿着一把琵琶。她穿着一件白色长袖连衣裙,衣袖和胸前有复杂的花朵图案,穿着传统的唐朝风格的裙子,蓝色腰带。女子留着一头乌黑的头发,梳成一个发髻,黑色的长发用发饰扎了起来。她脸上表情平静,闭上眼睛似乎在欣赏音乐,女子站立着,双脚与肩同宽,双手放在琵琶上。背景是风景秀丽的山景与蓝天,大面积的蓝天背景,中景相机角度拍摄,真实摄影风格,逼真照片”
翻译成英文:
“In the middle of the photo, a 20-year-old Asian woman stands on a rock, holding a pipa in her hand. She was wearing a white long sleeved dress with complex floral patterns on the sleeves and chest, a traditional Tang Dynasty style dress, and a blue waistband. The woman had a head of black hair, combed into a bun, and her long black hair was tied up with hair accessories. She had a calm expression on her face, closing her eyes as if enjoying music. The woman stood with her feet shoulder width apart and her hands on the pipa. The background is a beautiful mountain scenery and blue sky, with a large area of blue sky background. It was shot from a mid-range camera angle, with a realistic photography style and lifelike photos,best quality, masterpiece, highres, original, extremely detailed wallpaper, perfect lighting”
然后“文成图”生成新的图像,大家觉得效果如何?
但个人的认知毕竟有限,有些元素和风格可能难以准确描述,即便描述出来,还要翻译成英文,既费时又费力。因此,我们不妨适时借助一些工具,以提升质量和效率。
二、第三方AI工具
比如我会用KimiChat来编写提示词。打开KimiChat界面,上传参考图并发送指令,它会快速给出详细提示词。
如果需要修正错误或进一步细化描述,随时发送指令,它会立刻调整。
KimiChat推理出来的提示词,传达了猫的种类、外形特定、动作神态,以及室内环境中的黑色真皮沙发、黑白几何图案地毯,还有后面的台面、盆栽、装饰画等,非常准确详细,还是很不错的。
应用“文生图”生成的图片:
三、提示词反推插件
ComfyUI中的提示词反推插件非常多,这里我给大家介绍三款好用的插件:
Comfyui_CXH_joy_caption
Miaoshouai-Tagger
ComfyUI-WD14-Tagger
1.Comfyui_CXH_joy_caption
这款图片反推提示词插件,用过的小伙伴都说好!
它支持joy_caption、florence2和MiniCPMv2_6 prompt-generator三种模型。
以下是这三种模型针对同一张图片反推出来的提示词,效果如何,一看便知:
我们再来对比一下这三段提示词的生图效果:
Joy_caption的推理最为详细,不仅涵盖主体特征和基本元素,还对场景氛围进行了大量描述;florence2的反推缺乏了对场景氛围的描述;而MiniCPMv2_6最简短,仅推理了画面的主要元素,重绘图像的构图与原图差异较大,但原创性更强。
2.Miaoshou****AI Tagger
MiaoshouAI Tagger插件基于微软的Florence2模型,专门为生成和标注提示词而训练,因此它在生成提示词方面提高了准确性和相关性。
应用“文生图”生成的图片:
MiaoshouAI推理的还原度也很高,人物的发型、服饰细节,以及环境特点,都表现得很到位。
3.WD14 Tagger
WD14 Tagger插件最早出现在WebUI上,现在ComfyUI也可以使用,它会生成标签式的提示词。
应用“文生图”生成的图片:
WD14 Tagger推理得比较简单,只抓住画面的主要特征,对环境和细节的表现力不够。
最后,让我们来一场**“决战光明顶”,用同一张图比较人工手搓、借助第三方AI工具以及使用提示词反推插件这三种方式的生图效果。**
再换一个建筑场景来感受一下:
我们可以看到,即使是使用相同模型和参数,提示词的不同写法会带来不同的出图效果。尤其在提示词分析能力更强的Flux模型上,这种差异更为显著。
个人认为,几种反推方法各有优劣,大家可根据需求选择。相比图生图的复刻,图生文再生图更像是提取原图“灵魂”,生成的图片更具原创性和独立性。
如果你觉得我的分享对你有帮助,或者你想了解更多相关技巧和见解,那就别忘了点个关注哦!继续探索,继续创造,期待我们下次相见