AI 数字人制作（方案一）：输入一张图片和一段文字即可生成数字人

javastart

已于 2023-05-14 14:43:15 修改

阅读量1.2w

点赞数 7

分类专栏：大模型文章标签：语音识别人工智能

于 2023-05-12 22:59:29 首次发布

原文链接：https://www.bilibili.com/video/BV1wT411o7Un/?vd_source=8da5828b78773739a57389dbe786cd4f

版权

大模型专栏收录该内容

234 篇文章

订阅专栏

文章提供了三种AI数字人制作方案，包括使用开源项目整合的方案，涉及Text2Voice、LiveSpeechPortraits和Thin-Plate-Spline-Motion-Model；利用Wav2Lip和GFPGAN技术的方案；以及西安交大和腾讯的SadTalker项目，能替代D_ID生成高质量数字人。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

方案一：

原文：AI 数字人制作（方案一）_哔哩哔哩_bilibili

AI 文字和图片生成数字人(输入一张图片和一段文字即可生成数字人)

《用三个开源项目整合成可以商用的数字人项目》
文本生成语音开源地址：https://github.com/weineng-zhou/text2voice
语音驱动表情和嘴型开源地址：https://github.com/YuanxunLu/LiveSpeechPortraits
动作迁移开源地址：https://github.com/yoyo-nb/Thin-Plate-Spline-Motion-Model

Text+Image2DigitalPerson （浪子之心科技卢瑞）
1、输入文字 ------ 输入" text-input"
2、将文字转化成语音 ------ 输出 "voice-output"
3、输入------"voice-output"到语音驱动嘴唇及表情
4、用语音驱动嘴唇及表情（ LiveSpeechPortraits） ------ 输出“LiveSpeech-output”
5、输入图片 ------ 输入“image-input”到Thin-Plate-Spline-Motion-Model 进行动作迁移
6、动作迁移后 ------ 输出 “Moton-output”
7、最后将声音和视频合成 ------ 输出 “result”

备注：如果要商业，还需要视频融合，超分辨率，界面设计，打包部署等。

方案二：AI 数字人制作

原文：AI 数字人制作(方案二)_哔哩哔哩_bilibili

AI 自制数字人(Wav2Lip-GFPGAN)
Wav2Lip代码地址：https://github.com/Rudrabha/Wav2Lip
GFPGAN代码地址：https://github.com/TencentARC/GFPGAN
Wav2Lip-GFPGAN代码地址：https://github.com/ajay-sainy/Wav2Lip-GFPGAN
2D，2.5D数字人制作我已经出了好几个视频，制作方法也介绍了3个以上，后期将出3D数字人的制作方法视频。