文献阅读笔记(一)

文献原文地址:https://www.sciencedirect.com/science/article/pii/S0167865518301065?via%3Dihub

文献:Deep generative video prediction

该文献介绍了一种深度生成视频预测模型,主要由运动编码器,帧生成器,帧鉴别器组成。还使用了一种跨通道颜色梯度损失方式处理模糊。

1)运动编码器:给定一个动态时间序列,生成预测运动表征\widehat{Vt}(使用LSTM和3D卷积)

2)帧生成器:给定\widehat{Vt}和最后一帧视频帧Xt,生成\widehat{Xt+1}帧预测视频(伪反双流网络,动态流用于高频【边缘信息】动态评估,静态流用来维护低频信息)

3)帧鉴别器:(使用3D卷积网络)因为2D卷积网络不能对多个重叠图像进行识别

训练算法:

误差:

1)重构误差:使用L1型损失(L2型损失可能导致运动表征模糊化)

2)对抗误差:鉴别器D和生成器G对抗训练,达到纳什平衡

3)跨通道颜色梯度损失误差:相同位置两个通道之间的差值

4)组合:

数据集:

moving minst,UCF-101,Ms.pac-Man

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值