NB,豆包一口气给我画了20个分镜,还能保持一致性
原创 冷逸 沃垠AI 2025年04月26日 21:58 四川
今天,打开豆包网页版,无意间发现他们的绘图新功能上线了,叫“豆包CreationAgent v1.0 Beta”。
Beta版也就是测试版的意思,相较之前的图片3.0有了进一步升级。不仅更懂你的意图,还能通过多模型协作,批量出分镜图。
体验了一下午,贼NB,最多可一次性出图20张,还能保持超强的一致性。
比如,输入Prompt:
生成20个中国城市的知名地标建筑图。航拍视角,背景是该城市的知名地标建筑,2k。图片右上角用小字标注城市名和建筑名。比例9:16。
跟豆包的同学打听了下,这个功能目前正在灰测中。如果被灰到了,侧边栏会出现“智能升级”的提示。如果没有被灰到,建议再等等。
目前,只能在豆包网页版和豆包电脑版体验。
show case
先给大家看一些我跑的case,成功率还是比较高,少部分跑了2-3次,大部分都是一次生成。如果跑了2-3次都没有成功,建议改提示词,或者重新设计创意思路。
图片风格为「水墨画」,创作草船借箭的故事分镜,10张分镜图,保持风格一致。统一比例 「16:9」。
为它换上20种不同的服装,可以改变姿势。
你来设计一个老年蝙蝠侠的故事,风格用DC漫画的风格,主要讲超级英雄落幕的故事,8张,比例 「4:3」。
帮我生成10张连续性的童话绘本,关于狐狸、猫和老鼠相遇的童话故事。故事要有连贯性,角色不说话,纯粹使用动作来表达交流。
生成类似风格的漫画,至少5张以上。
这几张效果非常Nice,豆包对参考图的画面内容和画面风格的理解非常准确。
用多张图片,给我讲解下回锅肉的制作步骤。
画一个人emo了。
学习这张图片的创意,生成10张充满寓意的微摄影图片。
这几张图的效果真的太棒了。
生成12张词语的词条表情包,诙谐荒诞的扁平插画,风格和格式保持风格统一,不用解释词的意思,只是对文字做适当的变形来符合文字的意义。比如“内卷”这个词是卷曲的,“躺平”这个词是扁平的。。
制作《少年闰土》的分镜图,浓烈的版画风格。线条流畅,细腻纹理,黑白对比,极简主义,风格统一,比例 「16:9」。
一些总结
测了一下午,简单总结下。
豆包CreationAgent Beta版主要擅长:
-
1)连续性多图生成。无论是分镜还是绘本,豆包都能稳定生成20张以内的图片(也可以通过“连续对话”生成超过20张的图片),且都能保持一定的一致性,人物、场景、风格一致。
-
文生图,能生成上十张连续图不崩,真的不易。
-
据介绍,这源于豆包采用了智能代理技术,通过调用多个模型来协作完成。所以这个版本被命名为“DOUBAO CreationAgent v1.0Beta”。
-
2)意图理解进一步增强。即使用户的提示词不够精确,豆包依然能够理解其意图,生成符合用户期待的高质量图片。
-
3)可将草图具象化。无论是多么抽象的草图、概念图,豆包都能将其具象视觉。
这是我画的一个关于山脉的草图,按照你的构思,帮我生成一张图片。图片风格为「水墨画」。
卧槽,豆包画的图是真好。没想到,我这张垃圾草图也有用武之地。
不过,在我测的过程中,也发现豆包还存在一些问题。建议大家在使用过程中注意。
-
1)对于多图生成,建议添加“保持风格统一”prompt,约束其一致性。
-
2)人像较难保持一致性,建议不用真实人像的脸部来作为参考图。
-
3)绘本创作,你可以让豆包先生成一个人物特点介绍的描述,然后用这段描述来固定分镜的主体人物,这样可以提升主体一致性。
-
4)偶尔二次修改,豆包不工作,建议手动@出图像生成,保持在图像生成技能下使用。
写在最后
两个多周前,即梦3.0图片模型悄然更新,给设计行业带来了巨大的冲击。
很多人还没有完全玩会即梦3.0呢,如今豆包又带着全新的CreationAgent v1.0 Beta来了。用嘴改图,连续生图,生绘本,生分镜,给草图上色……
不得不说,在绘图这块,即梦&豆包越走越远。虽然还有一些缺陷,但在国产AI绘图里,已经是其他模型/产品的天花板。
而且,据豆包的同学透露,即梦近期正在密集内测视频3.0。
豆包CreationAgent生图+即梦视频3.0生视频,这下真的无敌了。