《TSM:Temporal Shift Module for Efﬁcient Video Understanding》阅读笔记

最新推荐文章于 2022-02-02 20:31:26 发布

程序小翰

最新推荐文章于 2022-02-02 20:31:26 发布

阅读量515

点赞数 1

文章标签：深度学习卷积

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40133804/article/details/106317484

版权

这篇论文的核心思想是通过在2DCNN中位移temporal维度上的channels，来实现视频中时间维度上的信息交互。作者分析了一般的卷积操作，其主要分为两个部分，1是位移，2是对应位置的权值相乘再相加。其中位移不消耗计算资源，所以，作者想到能否可以在temporal维度上位移，达到不同帧的特征信息交融来增强模型对视频信息的理解。位移过程如下图所示:

在这里插入图片描述
上图中，不同颜色代表不同帧的特征，其大小为chw*。图b中，在T方向上，将第一列向下位移1位，第二列向上位移1位，空出的部分补0填充。

**这样的位移方法也有它的弊端。**其一，大步长的位移会导致原始特征中补充的0太多，导致丢失重要信息。2、给硬件造成了负担，增加了内存的占用。3、降低了空间维度的建模能力，由于原有的空间特征被破坏，所以可能会导致变差。

为了去研究其优势和劣势，作者测量了TSM模型和2Dbaseline在不同硬件设备上的推理延迟。使用ResNet-50主干和8帧输入测量模型，使用无移位(2D基线)、部分移位(1/8、1/4、1/2)和全移位(移动所有通道)进行比较（下面曲线图a）。1000 次运行后（之前有200次的热身），发现位移操作相比baseline的确有延迟影响。移动所有通道，延迟开销将占到CPU推理时间的13.7%，移动1/8，延迟开销限制在3%.

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《TSM:Temporal Shift Module for Efﬁcient Video Understanding》阅读笔记

这篇论文的核心思想是通过在2DCNN中位移temporal维度上的channels，来实现视频中时间维度上的信息交互。作者分析了一般的卷积操作，其主要分为两个部分，1是位移，2是对应位置的权值相乘再相加。其中位移不消耗计算资源，所以，作者想到能否可以在temporal维度上位移，达到不同帧的特征信息交融来增强模型对视频信息的理解。位移过程如下图所示:上图中，不同颜色代表不同帧的特征，其大小为chw*。图b中，在T方向上，将第一列向下位移1位，第二列向上位移1位，空出的部分补0填充。**这样的位移方法也
复制链接

扫一扫

程序小翰 CSDN认证博客专家 CSDN认证企业博客

码龄7年

16: 原创

84万+: 周排名

169万+: 总排名

2万+: 访问

: 等级

312: 积分

1: 粉丝

21: 获赞

9: 评论

61: 收藏

私信

关注

热门文章

最新评论

torch.nn.function中pad的原理和用法
shixf626: 听君一席话，如听一席话
基于金字塔分层的LK光流学习笔记
DDDarling: 请问err误差向量的意思是两帧之间角点的移动距离吗
C++中vector、stack、unordered_map使用笔记
CSDN-Ada助手: 非常感谢CSDN博主分享的关于vector、stack、unordered_map的使用笔记，这篇博客对于学习C++的同学来说非常有帮助。我觉得下一篇博客可以写一些关于C++中的多线程编程或者数据结构与算法的实现，这样的技术文章对其他用户也会有很大的帮助。相信你的博客会有更多读者关注和学习，期待你的下一篇精彩文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
torch.nn.function中pad的原理和用法
一路低首不见云: 哈哈哈哈哈，懂了懂了。原来pad里面的值在每个维度上是对应前后两个呀。
《MARS: Motion-Augmented RGB Stream for Action Recognition》阅读笔记
weixin_44298038: 这个可以看做是知识蒸馏吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。