视频理解学习笔记（二）：I3D and Kinetics Dataset

不废江河954

于 2023-05-25 22:15:27 发布

阅读量745

点赞数

分类专栏：视频理解文章标签：视频理解人工智能计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_50652864/article/details/130872688

版权

视频理解专栏收录该内容

4 篇文章

订阅专栏

视频理解学习笔记（二）：I3D and Kinetics Dataset

视频理解的三个流派（怎么处理时序）
论文概览
Kinetics Dataset
模型详解
实验

视频理解的三个流派（怎么处理时序）

LSTM (a): ConvNet + LSTM
3D网络 (b): 3D-ConvNet
双流网络，利用光流 (c): Two-Stream

其他：

将3D和双流结合 (d): 3D-Fused
I3D (e): Two-Sream I3D

论文概览

Workshop: CVPR’17
论文标题：Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

论文地址：https://arxiv.org/abs/1705.07750

论文作者：

Joao Carreira from DeepMind
Andrew Zisserman from DeepMind and Department of Engineering Science, University of Oxford (他也是双流网络的二作)

主要贡献：

I3D：Two-Stream Inflated（扩大、膨胀）3D ConvNet，如何将2D模型扩大膨胀到3D模型。
Kinetics Dataset

Kinetics Dataset

该数据集包括400个人类动作的类别，每个类别对应至少400的视频片段，且每个片段都来自不同的YouTube视频。每个视频片段（clip）都是10s。

模型详解

将2D卷积网络扩张到3D（Inflating 2D ConvNets into 3D）

Inflate：保持2D卷积网络框架，将2D的卷积核全部替换成3D的卷积核，将2D的pooling全部替换成3D的pooling。

如何用预训练好的2D网络来初始化3D网络（Bootstrapping 3D filters from 2D Filters）

bootstrap：引导
将2D图片重复n次获得一个n帧的boring video；将2D预训练好的模型的参数重复n次，并且rescale（即除以n，因为初始化要保证2D网络和3D网络面对同样的输入，可以得到同样的输出），赋给3D模型。

网络结构

在这里插入图片描述

实验

在这里插入图片描述

迁移学习实验效果：
在这里插入图片描述
肯定了预训练和迁移学习。

和其他方法对比：
在这里插入图片描述

不废江河954

博客等级

码龄5年

37
原创

91
点赞

331
收藏

854
粉丝

关注

私信

热门文章

分类专栏

目标检测 4篇
视频理解 4篇
问题 3篇
快速复习 5篇
学习 5篇
CNN 1篇
深度学习 2篇
笔记 4篇
cpp笔记 1篇
刷题 1篇

最新评论

OpenPCDet详细安装指南+单/多GPU训练演示
糖炒栗子和烤红薯: 您好请问您这个问题解决了吗，我也遇到了。
用保存好的权重进行测试时准确率很低的原因
今天食堂吃什么: 怎么排查是否是因为多卡训练单卡测试才导致的关键字配不上呀？
OpenPCDet详细安装指南+单/多GPU训练演示
sdu_nav: 您好博主，我执行这个命令python setup.py develop报错: File "setup.py", line 27 print('__version__ = "%s"' % version, file=f) ^ SyntaxError: invalid syntax 这是怎么回事阿
OpenPCDet详细安装指南+单/多GPU训练演示
风起于微萍之末: 您好，我安装的环境没有报错，运行setup也提示成功了，生成的build文件夹里面也有相应的.so文件，但是在pcdet.ops.iou3d_nms.iou3d_nms_uyils.py内部import iou3d_nms_cuda时会提示没有这个文件，找了很多教程没找到解决办法。请问您遇见过吗
OpenPCDet详细安装指南+单/多GPU训练演示
NAVY小鹿: 您好，我训练数据的时候报错了，是什么问题啊，谢谢解答 (wlspcd) -bash-4.2$ python train.py --cfg_file cfgs/kitti_models/pv_rcnn.yaml --batch_size 1 --workers 1 --epochs 10 OpenPCDet successfully installed and imported! Traceback (most recent call last): File "train.py", line 7, in <module> from test import repeat_eval_ckpt ImportError: cannot import name 'repeat_eval_ckpt' from 'test' (../test.py)

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。