记录 之 最近阅读的动作识别(action recognition)工作

介绍:

其中C3D是3d卷积的比较有意义的开端,I3d在C3D之后做了一系列研究,包括引入双流网络,和LSTM网络,并使用已经训练好的2D图像分类模型的参数维数扩充后用做3D网络的预训练模型。S3D是在I3D的基础上,探索了卷积拆分,使得模型的量级下降,并在后续的工作中加入了Graph Convolution的一些思想。

TSN:time segment networks,主要时提出了一种新的采样策略,即将视频分K段,从每段中随机挑选若干(s)帧组成片段,则共有K*s帧被采样(这里不考虑反转裁剪等操作),最后融合K个段的预测结果。

TSM:time shift module则主要是引入了时间转移模块,沿时域做特征转移。加强了时域信息的交流融合。其帧采样策略采用的是稀疏采样策略(不同于传统的密集采样),继承了TSN的采样策略。

上面是一个整体的把握,如果有什么细节大家可以参考论文原文及github源码。

以下是几篇相对较好的博客,供大家参考

C3D:https://www.jianshu.com/p/09d1d8ffe8a4

TSM:https://zhuanlan.zhihu.com/p/66251207

S3D:https://blog.csdn.net/SIGAI_CSDN/article/details/85098096

I3D:https://zhuanlan.zhihu.com/p/58355093

TSN:https://blog.csdn.net/zhang_can/article/details/79618781

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值