Generating Videos With Scene Dynamics

最新推荐文章于 2021-05-27 13:41:00 发布

XMoyas

最新推荐文章于 2021-05-27 13:41:00 发布

阅读量903

点赞数

分类专栏：生成对抗网络文章标签：视频预测生成对抗网络

生成对抗网络专栏收录该内容

8 篇文章 0 订阅

订阅专栏

本文介绍了一种基于GAN的网络模型，该模型能够同时完成视频识别与视频生成任务。通过使用未标记的视频训练，模型不仅能生成短小且效果良好的视频，还能基于静态图像预测后续图像序列，并能提取用于图像分类的有效特征。实验采用了Places2预训练模型筛选视频场景，并通过人工评估的方式验证了模型在视频生成方面的有效性。

摘要由CSDN通过智能技术生成

来源：NIPS2016

装载自 https://blog.csdn.net/u010620946/article/details/53681081

这篇论文提出了一个基于GAN的网络模型，同时可以进行视频识别和视频生成的task。

Task

　　Video recognition & video Generation.

　　即利用一些Unlabeled videos 去训练模型同时解决识别问题和视频生成的任务。

实验表明：

模型可以生成一些短小的视频并且效果较好
可以根据static image 预测之后的图片序列
模型学习到的特征可以很好的用来进行图片分类

model

这里写图片描述

OneStream Architecture:

　　在Figure 1 中蓝色的部分即为 One Stream Architecture。

Two StreamArchitecture:

　　即Figure 1 完整版，因为One StreamArchitecture不能很好的建模实际情况：视频通常由静态的背景和动态的前景构成。

　　所以设计了双路的生成模型分别用来生成静态背景 Background 和前景动态Foreground。然后利用：

G2(z)=m(z)&#x2299;f(z)+(1&#x2212;m(z))&#x2299;b(z).” role=”presentation” style=”text-align: center; position: relative;”> G 2 (z) = m (z) ⊙ f (z) + (1 - m (z)) ⊙ b (z) .

G_2(z) = m(z)\odot f(z) + (1-m(z))\odot b(z).
　　合并前景和背景。

DiscriminatorNetwork

　　直接利用和生成模型对称的卷积网路结构用来作为判别模型。

Learningand Implementation

　　利用SGD来训练模型。激活函数采用ReLU。

数据集的处理

　　对于特征表示的学习可以直接利用unlabeled videos.

　　对于GAN网络的训练，采用Places2 pre-trained model 来进行过滤视频（依据场景类别），最后利用的四个场景类别：golf course, hospital rooms, beaches andtrain station.

　　同时对于相机抖动进行处理，防止出现背景变化的情况。

实验结果

　　tinyvideo 可以看到生成的动态视频。

对于实验结果如何评价

　　Evaluation Metric: We quantitatively evaluate our generation using apsychophysical two-alternative forced choice with workers on Amazon MechanicalTurk.

　　即人工评判，对照实验为 AutoEncoder (即Discriminator>endoer,Generator->decoder)

Video Representation Learning

　　即将GAN模型的Discrimination部分作为特征视频表示学习的模型。

实验证明效果挺好。

Future Generation

　　即CGAN (Conditional GAN), 利用静止的图片作为输入的condition。

　　同时加一个约束：input 和 generator生成的第一帧直接的L1 loss.

确保生成的视频和输入保持一致。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

XMoyas CSDN认证博客专家 CSDN认证企业博客

码龄10年

25: 原创

13万+: 周排名

6万+: 总排名

10万+: 访问

: 等级

1008: 积分

61: 粉丝

63: 获赞

17: 评论

185: 收藏

私信

关注

热门文章

分类专栏

最新评论

大模型推理：vllm多机多卡分布式本地部署
LEEEEEO_: dockerfile里面不需要加入ray么？ray如何安装的啊
大模型推理：vllm多机多卡分布式本地部署
XMoyas: Q6_k不是llama.cpp中的内容吗，llama.cpp我不熟悉哈，暂时解答不了您的问题。如果是vLLM部署，采用float16您的机器是没问题的，但如果没有机器间的高速通信，吞吐率比较低。给您个参考：我部署千问官方提供的72b gptq-int8量化模型，直观感受差不太多，而这1台机器就够了。
大模型推理：vllm多机多卡分布式本地部署
weixin_43495725: 请教，Ubuntu中部署70B+大模型，不量化，两台机器，每台机器4张4090 24G显卡。我也想部署不量化的模型，可以是70B,需要 70B*4=280G，两台机器也不到 200G，好像跑不下，不知道我算的对不对 ? 我想跑 Q6_k, 是不是三张就够了，但是不知道啥样的服务器能装下 ?
大模型推理：vllm多机多卡分布式本地部署
XMoyas: 参考该大佬博客：https://www.xiaoiluo.com/article/vllm-docker-server
大模型推理：vllm多机多卡分布式本地部署
XMoyas: 参考该博主文章：https://www.xiaoiluo.com/article/vllm-docker-server

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。