如何打造爆款AI虚拟主播——完整的逐步指南

数智笔记

于 2024-09-03 07:40:51 发布

阅读量1.4k

点赞数 27

分类专栏：多模态大模型文章标签：人工智能语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wjjc1017/article/details/141838897

版权

多模态大模型专栏收录该内容

6 篇文章

订阅专栏

如何打造爆款AI虚拟主播——完整的逐步指南

步骤 1：生成图像

第一步是生成你的AI影响者的摄影写真实的肖像。你可以使用任何图像生成器，但如果你追求一流的真实感，我推荐Midjourney或Flux。

这里有一个用Midjourney生成的示例图像：

提示：一幅电影摄影，中景，迷人的Instagram拉丁女人。她有着棕色的头发，带有紫色高光。迷人的女人。她有一张漂亮的脸，她坐在咖啡吧里。一位网红，面带微笑，手势仿佛在解释某事。

这是一个使用Freepik生成的图像，使用了相同的提示。

Midjourney AI 提示：一张电影摄影，特写镜头，时尚的拉丁女人。她有棕色头发和紫色挑染。迷人的女人。她有一张漂亮的脸，她坐在咖啡吧里。一个网红，微笑的脸，手势就像在解释什么

图片由 Jim Clyde Monge 提供

这是我最喜欢的：

提示：一张电影摄影，中景，魅力四射的拉丁女性。她的棕色头发有紫色高光。魅力女性。她有一张漂亮的脸，她坐在咖啡吧里。一个影响力人物，面带微笑，手势好像在解释什么

图片由 Jim Clyde Monge 提供

尽情玩弄提示，生成尽可能多的图像，直到为你的AI影响者获得完美的拍摄。

步骤 2：放大图像

在这个步骤中，我将使用 Freepik 图像放大器。这个工具由 Magnific AI 提供支持，因此结果肯定会非常出色。

Freepik图像放大器。这个工具由Magnific AI驱动，因此保证结果会非常棒。

图片由 Jim Clyde Monge 提供

这是最终结果：

Freepik 图片放大器。此工具由 Magnific AI 提供支持，因此可以保证结果非常出色。

图像作者：Jim Clyde Monge

我喜欢这个工具如何为皮肤和头发增加纹理，使整体图像更详细和逼真。虽然差异微妙，但在追求额外的真实感时却产生了巨大的不同。

另一种方法是通过RenderNet AI的TrueTouch功能来放大图像。只需进入RenderNet AI仪表板，选择TrueTouch功能并上传原始图像。

RenderNet AI的TrueTouch功能，用于提升图像质量。只需访问RenderNet AI仪表盘，选择TrueTouch功能并上传原始图像。

图片来自 Jim Clyde Monge

它同样强大，并且在您想要增强图像的程度上提供了更多的自定义选项。

这里是最终结果：

提示：一幅电影摄影，中景，魅力的拉丁裔女性。她的头发是棕色的，有紫色的高光。魅力女人。她的脸很美，她坐在咖啡厅里。一个影响者，面带微笑，手势仿佛在解释什么

图片来源：Jim Clyde Monge

哦哇，这张图片的细节水平看起来比我们在Freepik上做的还要好。皮肤质感更清晰，眼睛，哦哇，看起来非常真实。

步骤 3：将图像转换为视频

接下来的步骤是将我们在步骤2中创建的肖像图像转换为现实视频。为此，我们需要借助像Runway Gen-3、Kling AI、Vidu 或 Dream Machine by Luma这样的AI视频生成工具的帮助。

如果你不想支付高级服务费用（像我一样），最好的免费替代品是 Kling AI。Kling 提供每天 66 个视频生成积分，这应该足够创建至少五个 5 秒的视频片段。

前往Kling AI网站并创建一个帐户。访问AI视频页面，在“图像参考”选项卡下，上传我们的AI影响者图像。

Kling AI 网站并创建一个账户。访问 AI 视频页面，在“图像参考”选项卡下，上传我们的 AI 网红图像。

图像由 Jim Clyde Monge 提供

添加以下描述，以帮助指导AI我们想要什么类型的视频。

一位微笑着的女性在交谈，她在说话时使用双手，频繁眨眼，目光注视着观众。

你可以随意玩弄提示。

您可以根据自己的需要自定义提示。如果您希望您的AI影响者看起来沉思、机智，甚至略显恼怒——只要符合您的愿景即可。请记住，处理时间可能会根据排队中的其他免费用户数量而有所不同。目前，可能需要从几分钟到几小时不等。因此，请准备好等待。

这是最终视频的样子：

注意：如果您使用的是免费套餐，Kling AI 的生成时间将取决于队列长度。在这个例子中，生成时间几乎耗费了四个小时。

或者，你可以使用Runway的Gen-3 Turbo将图像转换为视频。目前，他们提供300个生成信用供免费使用。

Runway的Gen-3 Turbo将图像转换为视频。目前，他们提供300个生成积分供免费使用。

图片由 Jim Clyde Monge 提供

这是最终视频：

Runway的Gen-3 Turbo将图像转换为视频。目前，他们提供300个免费生成积分。

GIF来自Jim Clyde Monge

一个10秒的视频大约消耗30个积分。

太棒了！她看起来如此生动。我喜欢她脸上的表情，她似乎热情地分享成为网络红人的秘密。

但事情是这样的：她到底在说些什么？ 这就是下一步的所在——添加旁白并将她的嘴唇与之同步。

步骤4：编写脚本

现在我们已经得到了视频，是时候给你的AI影响者一个声音了。为此，你可以使用任何免费的AI聊天机器人，比如OpenAI的 ChatGPT、谷歌的 Gemini 或者Anthropic的 Claude AI。

这是一个简单的提示来开始：

在这个十秒钟的视频中，影响者微笑着看着镜头，兴奋地说：“大家好，我想和你们分享我爆红的秘密！最重要的是，要真实，自信，并且与粉丝建立联系。上传的时候加入独特的创意和个人风格，确保每个视频都有趣且引人入胜！记住，坚持就是胜利，让我们一起创造更多精彩内容吧！”

OpenAI ChatGPT 生成我的 AI 影响者脚本

图片由 Jim Clyde Monge 提供

“想知道我走红的秘诀吗？这全靠坚持、创造力，以及与观众互动！定期发布，保持内容的新鲜感，并始终回复评论。这样我就能把关注者变成一个社区，把每个帖子变成热门！”

简洁明了，直接切入主题——非常适合快速的网红视频。

步骤 5：添加旁白和口型同步

现在进入最后一步——为你的人工智能影响者添加声音，并将她的嘴唇与剧本同步。为此，我们使用RenderNet AI的叙述者功能。

注意 2： 此功能不在 RenderNet AI 提供的 10 个免费每日积分范围内。您必须购买积分才能使用该功能。生成一个 10 秒的视频剪辑将消耗 367 个积分。

要开始，请登录您的 RenderNet AI 帐户，然后前往讲述者页面。上传我们之前生成的视频，并按照提示操作。

Rendernet AI 叙述功能示例工作流程

图像由 Jim Clyde Monge 提供

注意 1： 视频必须为MP4格式，最大分辨率为2560x2560像素，最大帧率为60帧每秒。

如果您想交换脸部，您可以选择，但在这种情况下，我们将坚持我们的原始创作。

Rendernet AI 叙述功能示例工作流程

图片由 Jim Clyde Monge 提供

点击“下一步”按钮，设置声音和脚本（使用我们在第3步生成的脚本）。

Rendernet AI 叙述功能示例工作流程

图片由 Jim Clyde Monge 提供

在选择声音时，请确保选择与AI角色相匹配的声音。在这个例子中，我发现Rachel的声音非常适合我们的AI影响者。

Rendernet AI 叙述功能示例工作流程。语音选择

图片来源：Jim Clyde Monge

最后，点击生成按钮，等待过程完成。你将被带到RenderNet Studio，在那里你可以根据需要微调视频。

Rendernet AI叙述功能示例工作流程。编辑仪表板

图片来自 Jim Clyde Monge

一旦您满意，下载最终结果。这里是——一个完全同步嘴型、会说话的人工智能影响者视频。

这太酷了！我对这个结果感到非常惊讶。我知道它并不完美，但这项技术发展得如此迅速真是疯狂。我在不到一个小时的时间里就制作了自己的会说话的AI网红视频——这太不可思议了！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

数智笔记 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。