【视频理解】六、3D-ResNet

travellerss

已于 2023-09-17 09:05:35 修改

阅读量858

点赞数

分类专栏：视频理解文章标签：深度学习人工智能计算机视觉

于 2022-11-06 21:49:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30196905/article/details/127721946

版权

视频理解专栏收录该内容

15 篇文章 6 订阅

订阅专栏

目录

参考资料
第1章引言
第2章网络结构
第3章实验
第4章 Pytorch实现3D-ResNet

参考资料

论文：

Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

博客：

3D ResNet(Spatiotemporal 3D CNNs )

论文复现笔记：3D ResNets for Action Recognition

第1章引言

深度卷积神经网络具有大量的参数，使用大规模的数据集是非常重要的，比如使用 ImageNet 大型图像数据集训练好的模型，迁移到其他的任务上进行 Fine-tuning ，这样能够提高模型的性能，也能够很好地迁移到其他的任务上。

然而与图像识别数据集相比，可用于动作识别的视频数据集相对较小。有代表性的视频数据集，如 UCF101 和 HMDB-51 ，可以用来提供大小约为10K的真实视频，但即使它们仍然用作标准基准，这些数据集显然太小，无法用于从头优化CNN表示。

最近提出的Kinetics数据集的定位是视频数据集标准，大致相当于ImageNet与图像数据集相关的位置。为Kinetics 数据集收集了超过300K的视频，这意味着视频数据集的规模已经开始接近图像数据集的规模。

因此作者尝试将2D网络中的 ResNet 迁移至3D网络中，并且在Kinetics数据集上从头开始训练。

在这里插入图片描述

第2章网络结构

作者介绍了几种不同的ResNet以及对应的模块，具体结构图如下：

在这里插入图片描述

在这里插入图片描述

第3章实验

各种ResNet模型结构的实验结果如下：

在这里插入图片描述

在数据集上的结果：

在这里插入图片描述

第4章 Pytorch实现3D-ResNet

代码：

3D ResNets for Action Recognition

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
【视频理解】六、3D-ResNet

3D-ResNet
复制链接

扫一扫

专栏目录

travellerss CSDN认证博客专家 CSDN认证企业博客

码龄9年

69: 原创

4749: 周排名

214万+: 总排名

2万+: 访问

: 等级

757: 积分

3552: 粉丝

40: 获赞

6: 评论

295: 收藏

私信

关注

热门文章

分类专栏

最新评论

ThinkBook16+ 安装Win11和Ubuntu20.04双系统
Cratan: 博主，我的是14+ RTX4060版本。装ubuntu20后还正常，但一旦安装显卡驱动就挂了，重启也进不去系统。有没有可能和我没有更新Linux-firmware有关系。
【卷积神经网络系列】九、DenseNet
m0_75119111: 定义带BN的卷积：卷积+BN+ReLu,代码里的顺序错了吧
【卷积神经网络系列】十三、MobileNetV3
m0_75119111: 最后的那俩图是表整反了
【生成对抗网络系列】六、CycleGAN
阿依巴提: 宝藏博主了，写的是真好，过去两年多了才发现，我还等着你的StarGAN呢
【生成对抗网络系列】五、WGAN-GP
Giotto-C: 打扰了博主，想问一下。你有这篇文章（nips2017）的源代码吗（可以适用python3.8的）？之前下过但和python版本不适用，本人不太会改。想问一下您有吗，学习一下。感谢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

travellerss 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。