畅游Diffusion数字人(23):字节最新表情+动作模仿视频生成DreamActor-M1

畅游Diffusion数字人(0):专栏文章导航

前言:之前有很多动作模仿或者表情模仿的工作,但是如果要在实际使用中进行电影级的复刻工作,仅仅表情或动作模仿还不够,需要表情和动作一起模仿。最近字节跳动提出了一个表情+动作模仿视频生成DreamActor-M1。

目录

贡献概述

核心动机

方法详解

隐式面部表示

3D 头部球体:

3D身体骨架控制:

训练阶段

数据和训练


贡献概述

作者自己总结的几点贡献:

• 我们提出了一个基于整体 DiT 的框架和用于支持灵活多尺度合成的人体图像动画的渐进式训练策略。

• 我们设计了混合控

+-----------------------+ | 预训练水印提取器(阶段1) | +-----------------------+ | v +-----------------------+ | 输入:原始图像x₀、k位消息m | +-----------------------+ | v +-----------------------+ | 水印编码器(Wᴇ)生成残差δ | | - 添加攻击模拟层T(随机裁剪、JPEG压缩等) | | - 优化目标:最小化消息损失Lₘ(BCE) | +-----------------------+ | v +-----------------------+ | 输出:水印图像x_w = x₀ + αδ | +-----------------------+ | v +-----------------------+ | PCA白化处理 | | - 去除提取器输出相关性 | +-----------------------+ | v +-----------------------+ | 保存水印提取器W | +-----------------------+ +-----------------------+ | 微调LDM解码器(阶段2) | +-----------------------+ | v +-----------------------+ | 输入:潜在向量z(来自扩散过程)| +-----------------------+ | v +-----------------------+ | 原始解码器D生成x₀' = D(z) | +-----------------------+ | v +-----------------------+ | 微调解码器D_m生成x' = D_m(z) | | - 联合优化目标: | | L = Lₘ(BCE)+ λ_i L_i(Watson-VGG)| +-----------------------+ | v +-----------------------+ | 输出:含水印图像x' | +-----------------------+ +-----------------------+ | 生成与攻击模拟(阶段3) | +-----------------------+ | v +-----------------------+ +-----------------------+ | 生成任务选择 |----->| 文本到图像、修复、超分等 | +-----------------------+ +-----------------------+ | v +-----------------------+ | 应用图像修改T' | | - 裁剪(保留10%-50%内容) | | - 亮度调整、JPEG压缩 | +-----------------------+ | v +-----------------------+ | 输出:待检测图像x'' | +-----------------------+ +-----------------------+ | 水印检测与统计验证(阶段4)| +-----------------------+ | v +-----------------------+ | 提取消息m' = W(x'') | +-----------------------+ | v +-----------------------+ | 统计假设检验 | | - 检测任务: | | if M(m, m') ≥ τ → H₁成立 | | - 识别任务:
03-22
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

沉迷单车的追风少年

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值