数字人调研2.0

本文探讨了数字人在各行各业的应用,如影视制作、虚拟偶像、新闻报道、导游服务等,介绍了其背后的3D建模、动作捕捉和人工智能技术。同时,文章区分了虚拟人、数字人和虚拟数字人的概念,并展望了数字人技术的未来发展潜力和元宇宙的关联。
摘要由CSDN通过智能技术生成

数字人在现今各行各业的应用情况如何?

文章链接:【云驻共创】数字人在现今各行各业的应用情况如何?-云社区-华为云发表时间:2021-12-24

到底什么数字人?

  • 广义上,计算机模拟出的具有人的形态的虚拟人都叫做数字人。
  • 在平常的观感上,数字人是整合了人物形象模拟、人物声音克隆、自然语言处理、知识图谱解析等众多世界领先的人工智能技术的可视化数字虚拟人。他通过对人物形象的复制模拟,人物声音的克隆及语音合成,可随时随地与真人进行准确交互性对话。
  • 通俗的讲,数字人本质上是AI的一种进化,是通过计算机图形学技术进行虚拟制作的类人形象,没有现实世界中的身体。

数字人的本体存在于计算设备中(比如电脑、手机)中,通过显示设备呈现出来,让人类能通过眼睛看见。它具备人类的外观和行为模式,数字人具有人类身体的外观形体结构,表现出来的行为模式是与人类相仿的,数字人的影像通常是呈现出某种人类的活动。

数字人在现今的各行各业的应用情况如何?

数字人随着技术的发展已经逐渐在各行业中进行了应用,在生活中也可以看到,现在数字人的应用很多,比较常见的大致可见的有以下几种:

1.演员

     《速度与激情7》已经在国内上映了几天。男主角保罗·沃克(Paul Walker)在拍摄期间意外死亡后,整部电影究竟是怎么拍摄完毕的。       
       视觉制作公司Weta Digital effectshouse承接了让保罗点沃克“重生”的工作。剧组从前六部《速度与激情》未使用的镜头中选择符合未拍摄剧本所需的表情和动作,通过转换从而生成数字成像模型,再通过CG渲染出虚拟的保罗。在替身演员进行肢体动作的拍摄后,CG技术会对图像进行脸部替代,从而让保罗在银幕上重生。而声音部分,也采用同样的方式进行采集和重编,这算是虚拟人的在电影上的使用。尽管渲染的费用高达5000万美金,但相比重拍,这算是一笔划算的买卖了。

2.虚拟偶像

       二次元的虚拟人物有很多,像初音、洛天依、弱音等等,都是很多阿宅们喜欢的角色。这些二次元角色不仅外貌好看,而且都多才多艺,唱歌、跳舞、卖萌、撒娇样样精通,这样的妹子出现在自己面前,也难怪阿宅们如此着迷。

      “虚拟人”则意味着万亿、兆亿级的市场,每个人都可以拥有一张虚拟皮囊,共同打造一个元宇宙(Metaverse),“在这个虚拟宇宙里,你可以看到喜欢的艺人开演唱会,你自己能实时换装,请到虚拟健身教练,交友,找到陪伴你的虚拟人。

        2021年12月10日晚8点,虚拟偶像花小楼携手音乐制作人徐梦圆在《迷你世界》游戏中举办了首场虚拟演唱会。这场音乐盛会是《迷你世界》联手QQ音乐打造数字音乐场景的首次落地成果,不仅还原了现实演唱会场景,还融入了更多的沙盒游戏元素,实现了从“听音乐”向“玩音乐”升级,给用户带来“音乐元宇宙”的初体验。

3.数字记者

       ”小诤”的名字来自于革命战争时期的王诤将军。她是新华社和NExT Studios联合打造的数字记者,与其他作为娱乐形象出现的虚拟形象不同,小诤是专门面向航天主题和场景研发的数字记者,她也肩负着相当艰巨的任务:现场报道载人航天工程、行星探测工程等国家重大航天项目。可以说小诤就是为了航天而生,她所代表的就是中国人民数千年来对无尽的天空宇宙的向往之心。

       利用实时渲染技术制作的新华社数字记者、数字航天员“小诤”,她是纤毫毕现的超写实数字人,其生成时间是传统图形技术的百分之一到千分之一。

4.导游

       以虚拟讲解员为代表的虚拟数字人应用或为其贡献蓬勃力量,多个大景区已经上线数字人AI 导览服务,比如故宫,龙门石窟等,为游客提供个性化游览路线推荐,景点文物讲解等多种服务,不光是讲,还能问,还能声情并茂的答,非常的灵性。

5.其他

       数字人的应用还有很多地方,比如党建馆,银行大堂等服务型问答场所都是数字人的应用场景,将人们从枯燥的工作中解脱出来。数字人的应用场景很多,不仅仅局限在以上场景。

数字人涉及的技术都有哪些?

数字人的实现技术从两个方面进行分析,一方面是外在的表现,一方面是内在的实现。

1.外在的皮技术

当前外在的实现技术主要是3D建模动作捕捉技术,这也是当前比较完善的技术链,主要应用与影视创作、动画、VR\AR\MR、虚拟偶像等场景。上限很高。比如《阿凡达》、《魔兽世界》的CG制作。

游戏开发商Epic Games免费向公众开放这项技术,利用MetaHuman Creator「超级数字人开发工具」,普通人也可以创作逼真的数字人形象。

2.内在的魂的技术

高级的数字人现在基本上包含虚拟形象+语音交互(TTS、ASR)+自然语言理解(NLU)+深度学习等技术的实现。

声音转换技术,可以让后台真人替换,而面对虚拟数字人的人感知不到。声音转换基于深度学习和迁移学习技术,精准将原说话人的声音转换为目标说话人,同时保留原说话人的风格特色。让声音有更多的表现形式。

NLG与NLU等算法,这一块代表着数字人的核心——智能
NLU让AI能够理解人类的语言,NLG则让AI能够思考、输出并与人类交互。以OpenAI为例,近年来的几次预训练大模型(如GPT-3)都刷新了算法SOTA的历史纪录,甚至能够部分达到人类水平。

国际上这几年的超大预训练模型发展很迅速,从BERT到GPT1.0再到3.0,SOTA算法每年都在迭代, 人工智能技术的发展将会推动数字人的进一步智能化,多场景运用

数字人的未来如何?

这个命题的答案在上面的行业应用已经显而易见了,数字人出现在各个行业,甚至在有些地方比真人做的更出色,对于人工智能的发展的应用可能决定了数字人的发展上限,数字人的发展可能会更进一步的促进元宇宙的发展,技术是一切的根本,未来可期。


虚拟人、数字人、虚拟数字人

文章链接:虚拟人、数字人、虚拟数字人傻傻分不清?一文看懂数字人 - 知乎
发表时间:2022-10-21

虚拟人、数字人、虚拟数字人,这些名词有什么区别呢?这些名词目前没有标准统一的定义,在本文中笔者尝试从字面上技术上,以及其强调的目的几个方面理清它们的定义,以及之间的关系。讨论其定义和关系的意义在于对数字人这个领域进行规范化、标准化,以便传播过程中传递准确而清晰的定义,建立统一的认知,更利于行业发展。

虚拟人

网络上流行的虚拟网红、虚拟主播,称之为虚拟人(Virtual Human)。之所以称之为虚拟,第一点:人物的身份是虚构的,现实世界中不存在的,比如火热的的虚拟网红Lil Miquela,她在Instagram上的拥有300多万粉丝,她虚构的身份设定是生活在洛杉矶的一名19岁女生。

虚拟网红Lil Miquela

如果说身份是虚构的,那么电视剧或电影里的人类演员所扮演的角色也是可能是虚构的,但人类角色并不能称之为虚拟人,因为第二点:虚拟人没有现实世界中的身体,它是通过计算机图形学技术进行虚拟制作的,虚拟人的本体存在于计算设备中(比如电脑、手机)中,通过显示设备呈现出来,让人类能通过眼睛看见第三点:它具备人类的外观和行为模式,虚拟人具有人类身体的外观形体结构,表现出来的行为模式是与人类相仿的,虚拟人的影像通常是呈现出某种人类的活动。比如初音未来的的角色设定是16岁的歌姬,生日8月31日,身高与体重则分别是158cm与42kg,擅长流行歌曲,摇滚乐和舞蹈,网上传播的初音未来的图像视频主要是歌舞类型。

数字人

“数字人”一词来自于英文 Digital Human,中文翻译过来是“数字人类”,简称数字人,目前关于数字人并没有统一的定义。之所以称之为数字人,强调了它存在于数字世界。而数字世界是人类设计运行于计算设备上的代码和数据,它是计算设备上运行的程序,数字世界底层操纵的是0和1这样的数据,相对于人类物理世界来说,物理世界是真实的,数字世界是虚拟的。

【数字人包含虚拟人】数字人基本满足虚拟人的第二、三项特征,稍有区别的是,数字人的身份设定可以是按照现实世界中的人物进行设定,外观也可以完全一致,按照真人还原制作的数字人也可以称为数字孪生,比如数字王国制作的 Digi Doug。
简言之,数字人的身份可以是现实世界中存在的,也可以是不存在的。而虚拟人的身份在现实世界中不存在。

虚拟数字人 

中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会发布的《2020 年虚拟数字人发展白皮书》(以下简称“数字人白皮书”)中对虚拟数字人的描述是:“与上述医疗领域的数字化人体不同,本篇中所分析的虚拟数字人(以下简称“数字人”)是指具有数字化外形的虚拟人物。与具备实体的机器人不同,虚拟数字人依赖显示设备存在。虚拟数字人宜具备以下三方面特征:一是拥有人的外观,具有特定的相貌、性别和性格等人物特征;二是拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;三是拥有人的思想,具有识别外界环境、并能与人交流互动的能力。

百度百科中对虚拟人物的定义:虚拟人物指在现实中或历史上不存在的人物角色,它可以存在于电视剧、电影、漫画、游戏等的创作性作品中虚构的人物。

【数字人的范畴包含虚拟人,虚拟人的范畴包含虚拟数字人】数字人白皮书中描述的虚拟数字人是对上述虚拟人描述的延展,除了外观和行为,增加了思想和交流互动的部分。
简言之,虚拟人=外观+行为,虚拟数字人=外观+行为+思想与交流互动。

总结

而目前存在的大多数虚拟数字人自身是不具备思考的能力,与外界交互绝大多数是通过人操纵实现的交互,比如虚拟主播之类。目前通过人工智能技术提供的交互能力,其能力与人力幼童相比也是非常初级的。主要是因为目前人工智能的智能水平还比较低,能做的事情很有限。这一点,用过智能音箱的朋友应该都深有感触,无论是小度,还是小爱同学、天猫精灵,都只能对部分特定句式的问题给出有效回答。

数字人白皮书中对虚拟数字人是否必须满足其所述三项特征的描述上用词并不直接——“宜具备”。宜是多义词,作为形容词有”合适的“的意思,作为动词有”适合于“的意思,作为助动词有”应当“、”应该“的意思,但在现代汉语中多用于否定词(不宜),此处将宜理解为助动词”应该“比较合适语境,即”数字人应该具备以下三方面特征“,即不要求必须具备,只是期望具备。在不要求必须具备思想和交流互动的能力前提下,虚拟人和虚拟数字人是等价的,虚拟数字人强调虚拟身份和数字化制作特性。

对于不要求必须具备交流互动能力,虚构身份的数字人,数字人、虚拟人、虚拟数字人这三者概念可以认为是等同的,网络上很多文章中指的是这个级别的定义,三者经常混淆使用。从严格意义上来讲,上文对数字人定义更宽泛,后文使用“数字人”一词来进行讨论。


数字虚拟人深度产业分析报告

参考文章:【完整版】量子位虚拟数字人白皮书

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值