前言
图引用自: 讯飞智作-一站式在线音视频制作和AI创作工具。 (xfyun.cn)
(文章摘自https://virtual-man.xfyun.cn/products/aiomachine)
一、AIGC+数字人之技术分析
1. 多模态感知
通过智能交互机“视觉”、“听觉”、“触觉”的多模态感知,外加语音识别、图像处理、自然语言理解等核心技术,实现虚拟人与真人“面对面”进行实时互动交流。
2. 多维度表达
通过形象、声音、动作、表情、文字、图片、视频以及天气、地图、代码块等相关技能,实现虚拟人与用户进行多维度全方面的交流表达。
3. 自主定义
虚拟人智能交互机支持虚拟人形象、服装、声音定制,支持专业知识库定制、支持系统界面样式自定义、支持展现形式自定义等。
4. 外接大模型,实现产业赋能
虚拟数字人支持接入大模型,对范领域开放式知识问答、多模态输入和表达能力等七大维度能力进行使用。
二、AIGC+数字人之落地应用
1. AIGC+数字人创作
- AI配音、AI虚拟主播、AI智能交互(支持实时提问、打断、查询等功能)、PPT转视频+虚拟数字人讲解(从企业号文章、文档、PPT到视频号端到端)。用户只需简单地输入文本、发音人音频或虚拟形象,即可一键操作完成音、视频的制作。
- 友情提示:真人照片+音频素材+文本输入即可合成一段视频,小心相关的电信诈骗哦~
2. AIGC+数字人赋能产业
AIGC+数字人交互
- 政务便民、企业应用、金融服务、新闻媒体、智慧文旅、教育培训等场景。
图2.1 政务便民、企业应用、金融服务
图2.2 新闻媒体
图2.3 教育培训、招生宣传
图2.4 电商直播
三、数字人定制平台
科大讯飞:https://virtual-man.xfyun.cn/
百度智能云曦灵:https://xiling.cloud.baidu.com/