腾讯震撼发布!MOFA-Video:表情随心换,运动由你控,视频创作由你做主!

145 篇文章 7 订阅
111 篇文章 3 订阅

腾讯开源了一个非常全面的视频控制方式 MOFA-Video。支持通过箭头控制视频内容的运动方向,类似运动笔刷。还支持将原有视频的面部表情迁移到新生成的人脸视频上。上面两种控制方式也可以同时在一个画面中使用。

相关链接

代码地址:https://github.com/MyNiuuu/MOFA-Video

论文地址:https://arxiv.org/abs/2405.20222

试用链接:https://huggingface.co/MyNiuuu/MOFA-Video-Hybrid

论文阅读

MOFA-Video:通过生成运动场适应冻结图像到视频扩散模型的可控图像动画

摘要

我们提出了 MOFA-Video,这是一种先进的可控图像动画方法,它使用各种额外的可控信号(例如人体地标参考、手动轨迹,甚至提供的另一个视频)或它们的组合从给定的图像生成视频。这与以前的方法不同,以前的方法只能在特定的运动域上工作,或者在扩散之前表现出较弱的控制能力。

为了实现我们的目标,我们设计了几个领域感知的运动场适配器(即 MOFA-Adapters)来控制视频生成管道中生成的运动。对于 MOFA-Adapters,我们首先考虑视频的时间运动一致性,并从给定的稀疏控制条件生成密集的运动流,然后将给定图像的多尺度特征包装为引导特征,以稳定地生成视频扩散。我们为手动轨迹和人体地标分别训练两个运动适配器,因为它们都包含有关控制的稀疏信息。经过训练,不同领域的 MOFA-Adapters 也可以协同工作,实现更可控的视频生成。

方法

我们介绍了MOFA-Video,一种旨在适应不同领域的运动到冻结视频扩散模型的方法。通过采用稀疏到密集(S2D)运动生成和基于流的运动适应,MOFA-Video可以使用各种类型的控制信号(包括轨迹、关键点序列及其组合)有效地为单个图像动画。

在训练阶段,我们通过稀疏运动采样产生稀疏控制信号,然后通过预训练的SVD训练不同的mofa - adapter生成视频。在推理阶段,可以组合不同的mofa - adapter来共同控制冻结的SVD。

效果

基于轨迹的动画

基于关键点的面部图像动画

  • 来自驱动视频的关键点

  • 驱动音频的关键点

零样本功能

  • 混合控制

  • 运动画笔

  • 通过光流

消融研究

结论

我们提出了 MOFA-Video,一种先进的可控图像动画方法,它使用各种额外的可控信号(例如人体地标参考、手动轨迹,甚至提供的另一个视频)或它们的组合从给定的图像生成视频。这与以前的方法不同,以前的方法只能在特定的运动域上工作,或者在扩散之前表现出较弱的控制能力。

为了实现我们的目标,我们设计了几个领域感知的运动场适配器(即 MOFA-Adapters)来控制视频生成管道中生成的运动。对于 MOFA-Adapters,我们首先考虑视频的时间运动一致性,并从给定的稀疏控制条件生成密集的运动流,然后将给定图像的多尺度特征包装为引导特征,以稳定地生成视频扩散。我们为手动轨迹和人体地标分别训练两个运动适配器,因为它们都包含有关控制的稀疏信息。经过训练,不同领域的 MOFA-Adapters 也可以协同工作,实现更可控的视频生成。

  • 13
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
以下是两种多目标算法的Matlab代码示例: 1. 多目标萤火虫算法(MOFA_MOCS) ```matlab % MOFA_MOCS.m % 多目标萤火虫算法(MOFA_MOCS)的Matlab实现 % 初始化参数 N = 50; % 萤火虫数量 D = 10; % 问题维度 T = 100; % 迭代次数 alpha = 0.2; % 吸引度系数 beta0 = 1; % 初始发光强度 gamma = 0.97; % 发光强度衰减系数 lb = -5 * ones(1, D); % 搜索空间下界 ub = 5 * ones(1, D); % 搜索空间上界 % 初始化萤火虫位置和发光强度 x = repmat(lb, N, 1) + rand(N, D) .* repmat(ub - lb, N, 1); I = beta0 * ones(N, 1); % 迭代优化 for t = 1:T % 计算吸引度 dist = pdist2(x, x); [~, idx] = sort(dist, 2); for i = 1:N j = idx(i, 2); if I(i) < I(j) r = norm(x(i, :) - x(j, :)); I(i) = I(i) + alpha / r^2; x(i, :) = x(i, :) + alpha * (x(j, :) - x(i, :)) / r + 0.01 * randn(1, D); end end % 更新发光强度 I = gamma * I; % 限制搜索空间 x = max(x, lb); x = min(x, ub); end % 输出最优解 pareto_front = pareto_front(x); disp(pareto_front); % 定义Pareto前沿函数 function front = pareto_front(x) [N, D] = size(x); front = true(N, 1); for i = 1:N for j = 1:N if i ~= j if all(x(i, :) <= x(j, :)) && any(x(i, :) < x(j, :)) front(i) = false; break; end end end end end ``` 2. 多目标灰狼算法(MOWA) ```matlab % MOWA.m % 多目标灰狼算法(MOWA)的Matlab实现 % 初始化参数 N = 50; % 灰狼数量 D = 10; % 问题维度 T = 100; % 迭代次数 lb = -5 * ones(1, D); % 搜索空间下界 ub = 5 * ones(1, D); % 搜索空间上界 % 初始化灰狼位置 x = repmat(lb, N, 1) + rand(N, D) .* repmat(ub - lb, N, 1); % 迭代优化 for t = 1:T % 计算适应度 f = zeros(N, 2); for i = 1:N f(i, 1) = sum(x(i, :).^2); f(i, 2) = sum((x(i, :) - 1).^2); end % 计算距离和排序 dist = pdist2(f, f); [~, idx] = sort(dist, 2); % 更新灰狼位置 alpha = 2 - t * (2 / T); % 狼群层次 for i = 1:N A = 2 * alpha * rand(1, D) - alpha; C = 2 * rand(1, D); p = randi([1, N]); D = abs(C .* x(idx(i, 2), :) - x(idx(i, 1), :)); x(i, :) = x(idx(i, 1), :) + A .* D + 0.01 * randn(1, D); end % 限制搜索空间 x = max(x, lb); x = min(x, ub); end % 输出最优解 pareto_front = pareto_front(x); disp(pareto_front); % 定义Pareto前沿函数 function front = pareto_front(x) [N, D] = size(x); front = true(N, 1); for i = 1:N for j = 1:N if i ~= j if all(x(i, :) <= x(j, :)) && any(x(i, :) < x(j, :)) front(i) = false; break; end end end end end ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIGC Studio

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值