探索元宇宙的数字分身: 数字人行业简析

​有人在使用数字人的同时,就有人担心自己被数字人欺骗。有些人可能会用数字人来传播虚假信息或进行欺诈活动。现在,有一些公司和个人开始用数字人在短视频、广告和其他地方跟用户互动。这些数字人看起来很真实,但可能存一些问题。

1. 虚假宣传:有些公司可能会使用数字人来做广告,可能会夸大数字人的能力或者误导消费者,导致虚假宣传。

2. 侵犯隐私:有时候,数字人的形象可能会被不法分子用来侵犯别人的隐私,比如在媒体上发布虚假信息或者恶意攻击。

3. 伦理问题:数字人的使用也涉及到伦理问题。例如,如果一个数字人被用来制作淫秽、暴力或令人不悦的内容。

但与其焦虑,不如真正了解一下数字人的构建过程,这样一来知道目前的技术水平,是否值得担忧,二来了解到数字人的构建过程,也许能找到一些防范的方法。

数字人是怎么构建的

  1. 角色设计和概念开发:首先,我们需要确定数字人的外观、特点和个性,包括脸部表情、身体比例、服装等。这就像设计一个虚拟角色一样。

  2. 建模和细节雕刻:创建数字人的基本形状。然后,我们添加更多的细节,例如皮肤纹理、肌肉线条等。

  3. 骨骼和动画:为了让数字人具有活动性和表情,我们需要添加骨骼和动画。这就像给数字人“装上”骨架和让它动起来一样。

  4. 渲染和光照:为了让数字人在画面上看起来更真实,我们使用渲染技术和光照效果。这就像给数字人上妆一样。

  5. 后期制作和特效:添加一些特效,例如头发、血流、皱纹等,以增强数字人的逼真度。

  6. 语音合成:语音合成是让数字人能够说话的关键技术。通过语音合成软件,将文本转换成语音,使数字人能够发出声音。

  7. 集成记忆:利用LLM+RAG技术模拟人的记忆

环节很多,所以构建一个数字人,尤其是看起来不那么假的还是很有挑战的。要看起来不那么假,至少要能做到

1. 外貌和表情模拟:

数字人的外貌可以是逼真的三维模型或二维图像,具有面部表情、肢体动作和声音。模拟人类的外貌和表情需要高度精确的建模和渲染技术。 一些数字人甚至可以通过摄像头捕捉用户的表情和动作,并实时反映在虚拟角色身上。

2. 语音合成和自然语言处理:

需要具备与人类接近的语音发音习惯,以及人类能够理解的语言。 使用深度学习语音合成技术可以产生自然流畅的语音,甚至模仿某个指定人的音色和说话习惯来发音。 数字人还需要能够进行人类的自然语言对话,书写流利的文本语言,回答问题、交流信息等。

3. 情感智能和互动性: 数字人需要和正常人类一样,能够和其他人类进行互动。 拥有一定程度的智慧,可以理解和回应用户的指令、问题和情感。 - 具备情感智能,能够识别和回应用户的情感状态。

实现成本和挑战

要实现一个数字人,使用上也有成本,太过复杂,用户就不用了,这就需要大量的优化工作。

声音克隆中:

录音环境和设备要求:需要用户进行配合录音,因此不能对其录音环境和设备有过分要求。 录音时长:为了考虑用户体验,需要尽量缩短录音的时长。目前主流的声音克隆算法只需要几十秒清晰录音就可以克隆出用户的声音。 纯净度要求:AI会尝试模仿音频中听到的一切,包括说话人的速度、语调、口音、呼吸模式、强度以及噪音等。因此,提供高质量、无杂音、单一人声的音频样本至关重要。

在形象克隆中:

添加图片注释,不超过 140 字(可选)

数据采集的精度和质量:数字人形象克隆需要大量数据,但采集数据的精度和质量受到各种设备的限制。 虚拟数字人物的逼真程度:技术限制影响虚拟数字人物的行为和表情的逼真程度。提高逼真度需要不断改进算法和模型。 法律问题:数字人形象克隆涉及肖像权、著作权等法律问题。确保合法性和尊重隐私权是必要的。

动画生成中

画音同步很困难:数字人播动画需要确保嘴巴的动作与语音完美同步。如果画音同步不准确,观众可能会感到不适。

用户体验可能很差:数字人播动画的用户体验必须优秀。如果用户无法与数字人互动或遇到奇怪的问题,他们可能会流失,甚至产生反感。 虽然AI在解决过去问题方面表现出色,但在处理新问题时可能会显得很笨。数字人需要能够应对各种互动情境,各种奇怪的问题。

数字人离真正落地有多远

打造单独的一个数字人难,规模化要落地更难

产业链割裂:数字人的制作涉及多个环节,包括建模、渲染、动态捕捉等。然而,这些环节之间缺乏有效的沟通和协作,导致数字人制作成本高、周期长。

服务场景与演艺场景的隔阂:数字人在不同领域有不同的应用需求。但目前,演艺型数字人往往无法满足客户所需的业务能力,而服务型数字人则缺乏人设,难以与用户进行情感交流。

满足高频需求的成本高:数字人的生产效率仍然面临挑战。快速响应和个性化定制的需求使得数字人的制作成本较高。

数字人做得好的有那几家公司呢

虽然真正落地较远,但还是有不少勇士在攻克这个领域的难题。

百度曦灵:这是百度推出的数字人平台,主要面向商业用户。它集成了数字人生产、内容创作和业务配置服务。虽然功能相对简陋,但它可以用于数字人短视频和直播生成。

硅基智能:硅基智能的数字人还原度很高,形象逼真。硅基智能的产品分为两个独立的线路:「硅语」用于短视频,「小播秀」用于直播。

风平智能:风平智能的产品叫做「风平IP智造」,提供数字人短视频和直播功能。主要面向企业、机构、电商和专业内容生产者。

闪剪:闪剪是后起之秀,数字人效果和易用性备受用户赞同。它的短视频和直播软件相对轻量化,对C端用户友好。

总之,我相信元宇宙会兴起,到那时就依靠自己的数字分身为我打工赚钱吧【狗头】

  • 24
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值