虚拟数字人及AI相关应用分享

最新推荐文章于 2024-07-04 16:46:39 发布

超人Q

最新推荐文章于 2024-07-04 16:46:39 发布

阅读量1.2k

点赞数 21

分类专栏： AI人工智能文章标签：人工智能数字人短视频 AI直播

本文链接：https://blog.csdn.net/qlk_2007/article/details/138793768

版权

AI人工智能专栏收录该内容

1 篇文章

订阅专栏

一、虚拟数字人

1、简介

虚拟数字人可分为基础类和仿真智能类。可用于直播的，一般是仿真智能类；基础类动作缓慢，体验差，很容易被直播平台封号。

目前各大短视频平台上介绍的数字人，出于营销目的，有夸大宣传的情况。很多声称几百元领回一个数字人，大多是使用提前录制或生成的视频，而非通过建模学习的数字人，更无法进行人机对话。

仿真写实类数字人，不但可以预测嘴唇的动作，还可以用文字合成语音来表达，整个虚拟数字人的面容、身体、声音、动作生成均由AI实现，具有真人质感、辨识度高、互动性强的特点。数字人形象分为标准和定制两种。其中定制形象可根据真人比例制作，包括动作和声音学习等。

由于数字人全套软硬件设备等投入费用较高，目前市面上流行的玩法，初期找服务商购买数字人服务，降低运营成本。等到测试数字人直播结果适合自己，且达到理想的投入产出比后，再考虑搭建全套的数字人配套设施。

2、场景及应用

可用于短视频和直播。短视频可用于视频号中企业形象或产品宣传；直播主要用于带货，数字人直播本质只是一种工具，它能解决效率问题，但并不能很好地解决流量问题。

目前市面上的数字人直播，都是用于辅助形为，比如将数字人用于流量较差的深夜时段直播，晚间黄金时间段仍然由真人主播进行带货讲解。

直播需要通过电脑端数字人直播软件来实现，提前设置好直播间常见问题和答案，可以通过捕捉关键词模式自动回答问题。数字人开播方式：
（1）文本驱动，输出声音为AI声音，需提前编辑好直播文本;
（2）音频驱动，输出声音为真人声音，需要提前录制好声音文件;
（3）真人驱动，真人在后台说话驱动数字人口型进行直播，实时互动。

当前各大直播平台对数字人带货的规则限制各有不同，比如美团较松、抖音平台要求最严，经常会被封号。封禁理由一般有互动回答问题不智能，影响客户体验；发现有重复数字人形象在不同商家中使用，涉嫌违规。还有一种24小时使用数字人直播，无真人在线运营等，也会被封号。

3、投入预算及费用

目前数字人算力大模型中，百度和京东已经完成电脑端和手机安卓端的研发使用，很多数字人工厂平台也是接入他们的系统。腾讯、阿里也在数字人上有投入，主要在电脑端。

另外，南京本地数字人原创企业中，南京硅基智能科技有限公司是最早一批做数字人，且通过自研产品取得成功的代表。该企业先后被评为国家级专精特新“小巨人”企业和南京人工智能独角兽企业。

以下是南京硅基智能科技有限公司有关数字人的参考价格：

序号	项目	价格	定制周期	备注
1	形象克隆	8000元/年	3个工作日	包含1个形象克隆+赠送500分钟视频合成时长（有效期1年）;不包含声音克隆，【用系统的AI声音】或【自己传录音】
2	声音克隆	15000元/年	5个工作日	1个声音克隆+赠送5000分钟音频合成时长（有效期1年）;不包含形象克隆，还原度较高，接近真人声音，若自身带口音等，会适当存在机械感
3	数字人直播	5500元/月		内置30个免费的数字人模特选用，如需选用硅语平台其他数字人另加1999/个年，如需定制专属形象另加8000元/个年
4	季度直播	19800元/季		三个月直播+赠送一个数字人形象克隆名额
5	直播机	9000元		预估一次性投入，也可自行配置高配电脑。