E3D-LSTM

最新推荐文章于 2024-06-09 09:41:20 发布

Runner_of_nku

最新推荐文章于 2024-06-09 09:41:20 发布

阅读量1.4k

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Runner_of_nku/article/details/107115135

版权

ConvLSTM利用的是Conv2D+LSTM，E3D-LSTM提出的是采取Conv3D+LSTM的结构，处理的问题都是视频预测。

在学习E3D-LSTM文章之前，先看一下C3D，C3D其实就是利用Conv3D的一个CNN的网络架构，主要针对的也是视频的数据集，不过处理的问题是识别和分割方面的。C3D文章主要讲Conv2D在池化卷积过程中会丢失时间信息，作为视频数据集，采用Conv3D主要是将“Frame”当做一维放到了Tensor当中去做卷积。

简单来说就是[B,C,F,H,W]的数据([batch,channel,frame,height,width])对后三维做卷积，卷积核自然就变成三维的卷积核了，C3D还对不同size的卷积核做了对比试验，最后3*3*3的卷积核最优。

回到E3D-LSTM，整体大网络的框架是这样的：

Cell的结构是这样的：

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
E3D-LSTM

ConvLSTM利用的是Conv2D+LSTM，E3D-LSTM提出的是采取Conv3D+LSTM的结构，处理的问题都是视频预测。在学习E3D-LSTM文章之前，先看一下C3D，C3D其实就是利用Conv3D的一个CNN的网络架构，主要针对的也是视频的数据集，不过处理的问题是识别和分割方面的。C3D文章主要讲Conv2D在池化卷积过程中会丢失时间信息，作为视频数据集，采用Conv3D主要是将“Frame”当做一维放到了Tensor当中去做卷积。简单来说就是[B,C,F,H,W]的数据([batch,
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。