由于在距离开题只有十天的时间忽然被强制换到这个计算机视觉方向,主要就是人体行为识别,而且没啥可商量的,心情不是很舒服,但是也没办法,好事多磨吧!
,总要多去接触,不是吗!
【双流系列】
- Two-Stream Convolutional Networks for Action Recognition in Videos [NIPS2014] [论文主页]
- Convolutional Two-Stream Network Fusion for Video Action Recognition [CVPR2016] [论文主页] [Code]
备注:上面两篇文章都是基于双流神经网络进行的,而且出自于牛津大学的VGG组,非常强,两个作者Andrew Zisserman和Karen Simonyan都可以关注一下,如果对人体行为识别感兴趣的话。
然后第一篇没有代码,第二篇也没有Pytorch的,闲了自己可以复现一下,但是距离现在时间有些久远了,时效性可能不够了!
【TSN系列】——港中文汤晓鸥组的Limin Wang大神的作品2016年的作品,现在很多工作都基于此
- Temporal Segment Networks: Towards Good Practices for Deep Action Recognition [ECCV2016] [论文主页] [Code-Pytorch]
Limin Wang大佬的工作,大佬的主页:Limin Wang主页
这篇论文可以看作是对双流方法的一个加强版改进!也是目前的benchmark之一。该论文继承了双流网络的结构,但为了解决long-term的问题,提出使用多个双流网络,分别捕捉不同时序位置的short-term信息,然后进行融合,得到最后结果。