数字人,是指通过人工智能技术和数字化技术模拟出来的具有人类特征和行为的虚拟人物。随着科技的不断发展,数字人已经逐渐走进我们的生活,并在各个领域展现出了巨大的潜力和价值。
数字人的出现,不仅可以帮助人们更好地理解和探索人类的行为和思维方式,还可以为人们提供更加便捷和高效的服务。比如,在医疗领域,数字人可以模拟出各种疾病的症状和治疗方法,帮助医生更好地诊断和治疗病人;在教育领域,数字人可以扮演老师的角色,为学生提供个性化的学习指导和辅导。
除此之外,数字人还可以在娱乐、艺术等领域发挥重要作用。比如,在电影和游戏制作中,数字人可以扮演各种角色,为观众带来更加逼真和震撼的视听体验;在艺术创作中,数字人可以帮助艺术家实现更加复杂和精细的创作,开拓艺术的新境界。
以下项目资料是自己学习数字人时找的相关资料和学习部署的项目样例:
gpt模型接口:API 文档 | 元象大模型 (xverse.cn)
TTS接口(语音识别和语音合成):标贝开发文档(语音技术) - 飞书云文档 (feishu.cn)
数字人模型:SadTalker GitHub - OpenTalker/SadTalker: [CVPR 2023] SadTalker:Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation
华为数字人:GitHub - HMS-Core/hms-ml-demo: HMS ML Demo provides an example of integrating Huawei ML Kit service into applications. This example demonstrates how to integrate services provided by ML Kit, such as face detection, text recognition, image segmentation, asr, and tts.
以其中的Sadtalker为例,自己部署后实现的效果展示:

由于文章无法放视频文件,无法直接展示生成后的数字人视频效果,总之上述资料是本人想要开发一款可以实时互动对话的数字人项目而查找的学习资料和可以借鉴的案例,如果您有什么其他的想法或好的建议,欢迎你评论留言,私信!!!