一、描述词
找一款自己熟悉大模型编写提示词,deepseek,豆包,kimi等等都行
先自己想象一个场景,然后告诉ai,让它生成各种分镜头。比如下面一段提示词
你是⼀个 AI 绘画提⽰词专家,请帮忙⽣成⼀只拟⼈化的胖橘猫做饭的全过程提⽰词,要求输出每个分镜头提⽰词,分镜头包括:胖橘猫在菜场买菜、胖橘猫买完菜骑三轮⻋回家、胖橘猫洗菜、胖橘猫切菜、胖橘猫炒菜、胖橘猫摆满⼀桌丰盛的菜肴
以kimi为例演示,将上面一句输给kimi
提示词还是可以再优化下,提醒出橘猫的富有人性的一面,所以再加入下面一句
请对以上提示词进行优化,突出胖橘猫的拟人化人设
这一次形象多了
二、文生图
关于文生图有很多软件,常用的有即梦,可灵等等
这里使用即梦,先测试一下,输入一段提示词,看看生成效果
⼀只拟⼈化的肥胖的⼤橘猫,裹着厚厚⻩⾊碎花被⼦,圆脸,胖腮,嘟嘟脸,圆圆的⿊眼睛, 斜靠在床头的靠垫上,聚精会神地在床上刷苹果⼿机,室内暖光,床头柜上的台灯亮着⻩⾊的 光,床头柜上还有蓝⾊的猫猫玩具,装修⻛格是现代⻛格的家具和装饰。墙上是杜宾的装饰 画,窗外星光闪烁,窗帘是⽶⽩⾊。EOS 5D Mark IV 拍摄,⼤师级构图,平衡构图,⾼饱和 度,⾼对⽐度,⾼清晰度,32K,杰作。
将刚才kimi生成的提示词以此输入 图⽚ 2.0 Pro ⽣图模型,图⽚⽐例选择 9:16。稍等⽚刻就会⽣成4 张图⽚。
三、图生视频
每组里面挑选一张满意的图片,不满意可以再次生成
然后切换到视频生成,把刚才选中的图片上传,然后把kimi给的提示词加入,循环6次,生成每个5s的短视频。
目前测下来,图片生成大概10s,视频一分钟左右。
四、合并视频
把6短视频,放到剪影中
然后选择音频素材,给每段配上背景音乐,比如买菜的可以找个菜市场的,切菜的可以有切菜声,根据需要先搜索再选择
然后直接点到处就行了
效果如下:
橘猫平凡而快乐的一天