【AIGC-图片生成视频系列-2】八仙过海,各显神通:AI生成视频相关汇总剖析

目录

一. 生成视频中图像的一致性

二. 生成视频中的运动控制注入

移步公众号 「AI杰克王」,更多干货


最近「图片生成视频系列」层出不穷,我拜读并结合实践(对,就是手撕代码,有开源就撕),并对以下几篇文章的相似点以及关键点稍微做个总结:

一. 生成视频中图像的一致性

在图像生成视频的这个过程中,维持生成视频中图像的一致性是个很大的挑战,毕竟我们都不是很能接受,随着视频播放,画风逐渐不对劲。。。

因此,“八仙过海,各显神通”。

1.1 LivePhoto通过引入Reference latent, 并与输入Unet的噪声在通道维度cat操作,同时利用Content Encoder 把输入图片信息注入到Unet网络的每一层(down block, mid block, up block)中,利用‘双保险’来维持生成视频中图像的一致性。

LivePhoto: Real Image Animation with Text-guided Motion Control

1.2 DreaMoving利用Content Guider把人脸信息注入到Unet网络的每一层(down block, mid block, up block)中。其实这里Content Guider的作用与之前腾讯的工作IPAdapter 有点类似,利用IPAdapter的保持“概念”一致的能力来稳住生成视频中图像的一致性。

DreaMoving: A Human Dance Video Generation Framework based on Diffusion Models

1.3 MagicAnimate提出一个Appearance Encoder来专门保留人物的ID 信息,并把相关信息注入到Unet网络的(mid block 和up block)层,以此保证生成视频中人物ID一致性。

MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model

1.4 Animate Anyone 的做法和MagicAnimate类似, 也是专门训练了一个ReferenceNet, 用来维持Reference Image的人物形象的。

和MagicAnimate不同的是,这里ReferenceNet的Spatial-Attention层和Cross-Attention是逐层注入到对应的Unet网络所有层,包括(down block, mid block, up block)层。

Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character

二. 生成视频中的运动控制注入

2.1 LivePhoto 把视频中的运动划分为10级,在训练的时候,把运动对应的map与输入噪声latent作cat操作,一起送入Unet网络去噪。待训练完成,在推理阶段就可以通过输入运动的强度来控制生成视频中人物的运动幅度大小。

2.2 DreaMoving 则是专门训练了一个Video ControlNet, 注入控制信息到Unet网络的(mid block 和up block )中。这里的控制信息可以在姿态图(比如openpose或者DW pose),也可以是深度图。

2.3 MagicAnimate 和DreaMoving 类似,也是利用自己训练的Video ControlNet来控制人物的运动,不同的是,MagicAnimate 只能利用Densepose sequence来作为控制条件。不知为啥,MagicAnimate 这么独特,控制方式与众不同。

2.4 Animate Anyone 和DreaMoving 以及MagicAnimate 又有所不同,虽然也是利用姿态来作为控制条件,但并不是类似文本注入的方式直接注入到Unet网络结构中,而是与噪声一起作为输入进入到Unet网络中。


关注公众号【AI杰克王】

1. 回复“资源”,获取AIGC 博客教程,顶级大学PPT知识干货;

2. 回复“星球”,获取AIGC 免费知识星球入口,有前沿资深算法工程师分享讨论。

欢迎加入AI杰克王的免费知识星球,海量干货等着你,一起探讨学习AIGC!

  • 21
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
八仙过海是一个非常有趣的儿童游戏,如果您需要了解如何设计八仙过海网页的HTML代码,我可以提供一些基本的指导。 首先,在设计任何网页之前,您需要了解HTML的基础知识。HTML是一种标记语言,它用于创建Web页面。在HTML中,您可以使用各种标记来指示文本的结构、样式和格式。 以下是一个基本的八仙过海游戏网页的HTML代码: ``` <!DOCTYPE html> <html> <head> <title>八仙过海游戏</title> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <style> /* 在这里添加CSS样式 */ </style> </head> <body> <h1>八仙过海游戏</h1> <p>欢迎来到八仙过海游戏!</p> <img src="八仙过海.jpg" alt="八仙过海游戏"> <ul> <li>仙女下凡</li> <li>老顽童闹海</li> <li>铁拐李变羊</li> <li>韩湘子点秋香</li> <li>张果老倒骑驴</li> <li>何仙姑捉妖怪</li> <li>蓝采和三打白骨精</li> <li>太白金星赛棋</li> </ul> <p>玩法说明:......</p> <!-- 在这里添加JavaScript脚本 --> </body> </html> ``` 这个HTML代码包含了一些基本的元素,包括页面标题、字符集、视口大小、文本、图像和列表。还可以通过添加CSS样式和JavaScript脚本来增强页面的样式和功能。 如果您想要更深入地了解如何设计网页的HTML代码,可以参考一些在线教程或书籍。同时,也可以在设计网页时参考其他类似的游戏页面来获取灵感和借鉴。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值