让AI数字人具有不一样的“灵魂”,未来数字人主战场在垂直场景中

从网页到App,再到数字人。人类一直在视图模仿和复制真实的人类的沟通交流方式。但是由于技术、时代的局限,数字人离想象中的形象还有点差距。如今,随着AI技术的发展,数字人正逐步成为我们生活的存在。

在谈到数字人的过去时,很多人认为最初的数字人仅仅是个被炒起来的概念,不接地气,分不清到底数字人的终点是影像还是游戏。并且打造的成本异常高昂,投入大量时间和人力成本。一个3D话的写实数字人,成本可达到数百万,每秒都时候在烧钱,除了用在教育、娱乐、影视、文娱等方向,最后有一些新奇的体验感外也没有什么,让很多人对于数字人的应用望而却步。以抖音美妆达人“柳夜熙”为例,其制作企业创壹科技CEO梁子康曾对媒体表示,“柳夜熙”仅制作投入就在百万元级别,而第一条“柳夜熙”的短视频成本约几十万元。超写实虚拟人视频每秒的成本都在万元区间。而花费了如此巨大的数字人,最后还是只能局限在娱乐、直播、内容IP等领域;

2020年,被誉为元宇宙元年的市场对于数字人生产效率提升和商业化开始有了转机。AIGC给了数字人更多的想象。基本上数字人+AIGC,从文字生成图片,再到文字生成视频,内容驱动数字人、真人驱动数字人等场景,让数字人具有了交互的能力。可以说,之前的局限性被AIGC的崛起打破。

其中几项关键的技术,让数字人极大地提升了交互和降低了成本。例如,人像驱动生成数字人,可以通过4D扫描、智能绑定等AI技术,实现数字人的唇形驱动、肢体驱动、表情驱动、手势感知等,同时减少动作捕捉、CG合成的制作流程,大幅降低了成本。而智能对话引擎,通过自然语言处理技术,为数字人快速定制对话能力、持续提升对话效果。这些技术,让数字人在表现力、智慧度、交互能力上都得到了大幅提升。

国内各大企业,开始在数字人领域八仙过海,各显神通。

例如,百度推出的曦灵数字人平台,通过自然语言处理、语音识别、计算机视觉等技术的提升,让数字人在视觉表现力上有了显著提升。

腾讯在数字人方面,也发布了智能小样本数智人生产平台。只需经过3分钟真人口播视频、100句语音素材的训练,便可在输入音频、文本等多模态数据后,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人”,其使用成本也将被降至千元级别。

除了百度、腾讯这些大厂外,一些默默耕耘于数字人垂直赛道的企业,也凭借日益精湛的技术,打造出了更逼真和生动的数字人。metamind项目中的轨迹大脑SaaS平台,就是这样一个代表,主打可定制可控知识,知识一键导入。配置化生成低成本高质量数字人的同事,能够赋予每个数字人专属的硅基知识,丰富垂直场景的应用能力。同事通过深度学习技术,不断完善语料、知识的构建。

从目前市面上来看,数字人技术正在不断的针对垂直领域的场景进行落地。AIGC加持的数字人已经由几百万元的制作成本,降低到现在的千元水平。且已经不仅仅只是存在于B端,而是逐步向C端扩散。

纵观每次技术的变革,无一不是一种生产工具,解放者沉重的生产效率。未来,AIGC时代,数字人将有能力理解人类的需求和习惯,同时会帮助人类“读他们没有时间读的书。”先进的大模型,与数字人进行结合的最大意义在于,让数字人能够以普通人无法企及的速度继续进化。决定数字人高下的一定是在垂直场景应用中,谁能利用大模型打磨好数字人,让AI数字人具有不一样的“灵魂”

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值