你的数字人处在哪个阶段?

cda7d74c9e7ad1c9394cd8cb7a4fd87e.gif

Mixlab

如果你拥有了自己的数字人,会将如何使用ta?

acc83608adbef6d836450a0ff75a7207.png

小杜

我需要一位虚拟主播来播报我的推送文章~

最近正好尝试了一种虚拟人的解决方案

016015f26a962c9f98242f56cd70dbec.png

shadow

3916b8b6e683921a107cc276003a59ed.png

小杜

厉害了,制作用到了什么技术?

TTS+一张图片+一段驱动动作(first order motion)

99b885d5df08992e0b193beeb903f4eb.png

shadow

e7d3f6eabdec873ee4b4d520acc36d2c.png

小杜

查阅了下资料,这种驱动数字人属于 First order motion model

- First Order Motion Model for Image Animation

5a482ab858ba83148997de36c4054b3e.png

03401abebcd43ba1062f296b12d2b0fb.gif

b821738024795b1fea4eb26ce333aaae.gif

eb83f547111e33f32fa863118b44432b.gif

# 功能 & 自评

无需对目标图像进行任何加注或者信息预处理,就可依据动画驱动数据源的动画轨迹来生成动画。

Our framework scores best on diverse benchmarks and on a variety of object categories.

#项目 & 论文地址

aliaksandrsiarohin.github.io/first-order-model-website

github.com/AliaksandrSiarohin/first-order-model

- TTS 技术

Test-To-Speech 使用语音 API 将书面文本转换为具有多种声音和语言的自然语音。用生成的语言与世界各地的客户交谈,创造更好的客户体验。 

f41c56fcf41fe451c79ca1d005278e2c.png

# vonage 专业文本转语音工具

6c60e8012e21b51399252f66279e429e.png

Synthesia 运用TTS + first order motion 的数字人视频生成工具

2976ee06a51f55e357dd7e5e5ceb2159.png

ML1726

上述案例多用于“离线式”的数字人应用场景。如果需要与数字人进行实时的交流沟通,有项目采用的是 ASR+TTS+Audio2face 方案。

042e79a99f216b5f45b5b654f12d5ed6.png

ASR 自动语音识别 + TTS 文本转语音 +Voice2Face 语音控制驱动模型(声音数据对应的标签是模型动画的 blendshape 权重)

d1fe3f45cda8a61797e79aebeb2b443b.png

小杜

可以上手体验下开源项目,自己制作数字人

FACEGOOD

b95e4346d8d5676dccf5b6c7307d5005.png

FACEGOOD 将音频转换为混合权重(blendshape 权重),并在 UE 项目中驱动数字人小美。FACEGOOD为小美打造的Test部分和UE项目不提供商业用途,仅供测试使用。

#项目地址

github.com/FACEGOOD/Voice2Face

3214d369fb70ce40396454efde074ecd.png

ML1593

举手🙋‍♂️,现在比较困扰的问题是通用元宇宙身份解决方案。将一个通用的虚拟形象迁入多个平台有什么简单快捷的方法吗?

或许从摄像头这块接入是最便捷的方法?这类数字人算是元宇宙的初级分身了。

99a3a714c5cba503a72cb48f145444cf.png

shadow

- Snap Camera

5826afeb9913015a449e2cd77f99617d.png

Snap Camera 可调用用户设备的摄像头,在任何平台使用摄像头输出头像或视频时均可使用Snap Camera的滤镜库

c101da8e21e8403e66559ba26eada8b2.png

小杜

试试用 Snap Camera 迁入 Vland 元宇宙空间

54b5e2b25a411225d634fc9f9fc532ac.png

13de641e34121b10fe2af4a1fb9254ec.png

小杜

用摄像头作为跨平台通用形象接入的切入口还挺简易高效的,只是效果渲染层面还有待提高哈,期待 摄像头—完全体数字人化身 产品的出现。

05950e116660c82a358c52b2972730ea.png

e633bbde12abf16af1464fb07469302d.png

小杜

又来小酒馆玩耍了,这次小酒馆开业展示了不少精彩的作品,欢迎大家前去体验。分享一个十分惊艳的作品,介绍的是与生物设计与计算设计相关的内容,不容错过哦~

312daf8e13a0fc311bef4f3af9d6c5ba.png

bf99ea57882e1028b23a9d57df33a5df.png

6c7831befa025a0807ffb763fdcf10c4.png

4e52e678a3f54294e5707df22ee1d9e2.png

......

Mix宇宙小酒馆展览地址:

https://beta.vland.live/app/scene?eventId=61eec7e0f20ef01f63b7539a

6f2a17a1ea91cef00708c132b48ca0af.gif

Mixlab

数字人专题分享系列已开启~

数字人·驱动方式

数字人·虚拟偶像制作

数字人·实业应用场景

数字人·趋势展望

1353007970afc6f5c34b207b34ab6000.png

入群

备注:数字人

[ 元宇宙创作者指南 ] 

[ 元宇宙资源清单 ]

github.com/shadowcz007/awesome-metaverse

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值