我的第一个 AI 数字人，全过程拆解

拂晓 AI 编程

于 2024-01-14 07:00:00 发布

阅读量552

点赞数 8

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/matlab5186688/article/details/135591886

版权

欢迎点击上面的蓝字关注拂晓AI数字人

从起心动念，到开始动手实践，最后做第一个 AI 数字人，还是花了我不少时间的，最长的时间都耗费在心理斗争上了，真正做起来，第一次也就 5，6 个小时，基本上把全流程跑通了，如果第二次做的话，初步测算，一半时间就搞定了，再下一次可能时间再对半减。

数字人本质上还是一个视频，只是交互上比较单一，人始终是整个画面的核心。

一段完整的视频，拆解出来，就是文案+声音+图片+串联。

文案，比较简单，口播的速度一般 200 到 300 字每分钟，所以要制作一个一分钟的数字人视频，一段 300 字的小文章足够用了

声音，主要是文字转声音，声音里面包括声音所代表的性别，年龄，中国人还是外国人，方言还是普通话，还有播报的速度，可以直接自己录一段文字，进行训练，训练完成之后，再用自己的音色播报文字，也可以直接用内置声音。

图片数字人，也就是上传照片，生成一个属于自己的定制的数字人。这个要准备一张自己的帅帅的正面照片，上传到工具上就可以了，很简单。照片怎么来，我是用我自己的图片作为垫图，让 mj 画的。可以生成自己的卡通形象，也可以生成自己的正式照。

最后一步，串联，通过数字人制作工具，把图片，文字或声音上传，点击生成就可以完成一个完整的数字人口播视频了，如果有水印，需要字幕可以导入视频剪辑工具简单处理一下，就可以发布各大平台了。

下面是模板和工具链。

文案：200 到 300 字每分钟，chatgpt +爆款文章，爆款标题，可直接配成中英文翻译的

声音：我使用的平台现有的，调整一下播放速度，听着舒服就可以。

图片数字人：一次制作多次使用，使用 heygen 直接传图片生成。

串联：剪映，主要配字幕，去水印，调分辨率适配不同平台。

做出来的效果：见山河一景

我的免费星球，个人 IP、AI数字人、AI 编程的学习感悟和经验分享，欢迎关注。

如果对你有用，欢迎点赞，在看，转发

拂晓 AI 编程

博客等级

码龄15年

29
原创

143
点赞

122
收藏

99
粉丝

关注

私信

热门文章

分类专栏

AI提示词 5篇
AI提效 5篇
AI 1篇

最新评论

AI数字人：90%的人不知道的高级用法
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
5210 写作法，保证你能持续稳定输出
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
AI提示词-批量自动生成API接口定义
CSDN-Ada助手: 恭喜你开始了博客创作的第一步！标题看起来很有趣，我期待着看到你更多关于AI提示词和API接口定义的内容。建议你可以在下一篇博客中加入一些实际案例或者个人观点，这样可以更好地吸引读者。加油！希望你的博客越来越好！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
AI 提效辅助定位问题—spark streaming 只分配 driver 问题定位
CSDN-Ada助手: 非常感谢您的分享！恭喜您写了第三篇博客，标题看起来就很有意思。您所介绍的AI提效辅助定位问题的方法似乎对于解决spark streaming只分配driver问题非常实用。我很期待阅读您的博客，了解更多关于这个问题的内容。同时，我也想鼓励您继续创作，因为您的文章对读者来说非常有帮助。如果可以的话，我建议您在下一篇博客中可以尝试探讨一下如何优化spark streaming的性能或者介绍一些实际案例，这样可以进一步拓展读者的知识面。谢谢您的分享，期待您的下一篇文章！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
AI提示词从小白到专家系列-批量生成建表语句
CSDN-Ada助手: 这篇博客的标题很吸引人，让人期待能够从小白到专家的过程中获得新的技能。你在这个系列中展示了如何使用AI提示词来批量生成建表语句，这对于很多人来说是非常有用的。希望你能继续创作下去，分享更多类似的技巧和知识。除了建表语句的生成，你可能还可以探索一些与数据库相关的其他主题，比如数据的导入和导出、索引的优化、查询性能的提升等等。这些都是数据库开发中非常重要的技能和知识点，希望你可以在未来的博客中进行分享。谢谢你的分享，并期待你的下一篇博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

拂晓 AI 编程 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。