如何打造爆款AI虚拟主播——完整的逐步指南
步骤 1:生成图像
第一步是生成你的AI影响者的摄影写真实的肖像。你可以使用任何图像生成器,但如果你追求一流的真实感,我推荐Midjourney或Flux。
这里有一个用Midjourney生成的示例图像:
提示:一幅电影摄影,中景,迷人的Instagram拉丁女人。她有着棕色的头发,带有紫色高光。迷人的女人。她有一张漂亮的脸,她坐在咖啡吧里。一位网红,面带微笑,手势仿佛在解释某事。
这是一个使用Freepik生成的图像,使用了相同的提示。
图片由 Jim Clyde Monge 提供
这是我最喜欢的:
图片由 Jim Clyde Monge 提供
尽情玩弄提示,生成尽可能多的图像,直到为你的AI影响者获得完美的拍摄。
步骤 2:放大图像
在这个步骤中,我将使用 Freepik 图像放大器。这个工具由 Magnific AI 提供支持,因此结果肯定会非常出色。
图片由 Jim Clyde Monge 提供
这是最终结果:
图像作者:Jim Clyde Monge
我喜欢这个工具如何为皮肤和头发增加纹理,使整体图像更详细和逼真。虽然差异微妙,但在追求额外的真实感时却产生了巨大的不同。
另一种方法是通过RenderNet AI的TrueTouch功能来放大图像。只需进入RenderNet AI仪表板,选择TrueTouch功能并上传原始图像。
图片来自 Jim Clyde Monge
它同样强大,并且在您想要增强图像的程度上提供了更多的自定义选项。
这里是最终结果:
图片来源:Jim Clyde Monge
哦哇,这张图片的细节水平看起来比我们在Freepik上做的还要好。皮肤质感更清晰,眼睛,哦哇,看起来非常真实。
步骤 3:将图像转换为视频
接下来的步骤是将我们在步骤2中创建的肖像图像转换为现实视频。为此,我们需要借助像Runway Gen-3、Kling AI、Vidu 或 Dream Machine by Luma这样的AI视频生成工具的帮助。
如果你不想支付高级服务费用(像我一样),最好的免费替代品是 Kling AI。Kling 提供每天 66 个视频生成积分,这应该足够创建至少五个 5 秒的视频片段。
前往Kling AI网站并创建一个帐户。访问AI视频页面,在“图像参考”选项卡下,上传我们的AI影响者图像。
图像由 Jim Clyde Monge 提供
添加以下描述,以帮助指导AI我们想要什么类型的视频。
一位微笑着的女性在交谈,她在说话时使用双手,频繁眨眼,目光注视着观众。
你可以随意玩弄提示。
您可以根据自己的需要自定义提示。如果您希望您的AI影响者看起来沉思、机智,甚至略显恼怒——只要符合您的愿景即可。请记住,处理时间可能会根据排队中的其他免费用户数量而有所不同。目前,可能需要从几分钟到几小时不等。因此,请准备好等待。
这是最终视频的样子:
注意:如果您使用的是免费套餐,Kling AI 的生成时间将取决于队列长度。在这个例子中,生成时间几乎耗费了四个小时。
或者,你可以使用Runway的Gen-3 Turbo将图像转换为视频。目前,他们提供300个生成信用供免费使用。
图片由 Jim Clyde Monge 提供
这是最终视频:
GIF来自Jim Clyde Monge
一个10秒的视频大约消耗30个积分。
太棒了!她看起来如此生动。我喜欢她脸上的表情,她似乎热情地分享成为网络红人的秘密。
但事情是这样的:她到底在说些什么? 这就是下一步的所在——添加旁白并将她的嘴唇与之同步。
步骤4:编写脚本
现在我们已经得到了视频,是时候给你的AI影响者一个声音了。为此,你可以使用任何免费的AI聊天机器人,比如OpenAI的 ChatGPT、谷歌的 Gemini 或者Anthropic的 Claude AI。
这是一个简单的提示来开始:
在这个十秒钟的视频中,影响者微笑着看着镜头,兴奋地说:“大家好,我想和你们分享我爆红的秘密!最重要的是,要真实,自信,并且与粉丝建立联系。上传的时候加入独特的创意和个人风格,确保每个视频都有趣且引人入胜!记住,坚持就是胜利,让我们一起创造更多精彩内容吧!”
图片由 Jim Clyde Monge 提供
“想知道我走红的秘诀吗?这全靠坚持、创造力,以及与观众互动!定期发布,保持内容的新鲜感,并始终回复评论。这样我就能把关注者变成一个社区,把每个帖子变成热门!”
简洁明了,直接切入主题——非常适合快速的网红视频。
步骤 5:添加旁白和口型同步
现在进入最后一步——为你的人工智能影响者添加声音,并将她的嘴唇与剧本同步。为此,我们使用RenderNet AI的叙述者功能。
注意 2: 此功能不在 RenderNet AI 提供的 10 个免费每日积分范围内。您必须购买积分才能使用该功能。生成一个 10 秒的视频剪辑将消耗 367 个积分。
要开始,请登录您的 RenderNet AI 帐户,然后前往讲述者页面。上传我们之前生成的视频,并按照提示操作。
图像由 Jim Clyde Monge 提供
注意 1: 视频必须为MP4格式,最大分辨率为2560x2560像素,最大帧率为60帧每秒。
如果您想交换脸部,您可以选择,但在这种情况下,我们将坚持我们的原始创作。
图片由 Jim Clyde Monge 提供
点击“下一步”按钮,设置声音和脚本(使用我们在第3步生成的脚本)。
图片由 Jim Clyde Monge 提供
在选择声音时,请确保选择与AI角色相匹配的声音。在这个例子中,我发现Rachel的声音非常适合我们的AI影响者。
图片来源:Jim Clyde Monge
最后,点击生成按钮,等待过程完成。你将被带到RenderNet Studio,在那里你可以根据需要微调视频。
图片来自 Jim Clyde Monge
一旦您满意,下载最终结果。这里是——一个完全同步嘴型、会说话的人工智能影响者视频。
这太酷了!我对这个结果感到非常惊讶。我知道它并不完美,但这项技术发展得如此迅速真是疯狂。我在不到一个小时的时间里就制作了自己的会说话的AI网红视频——这太不可思议了!