2021-03-17

最新推荐文章于 2021-11-10 17:26:45 发布

啥也不会是真滴拉跨

最新推荐文章于 2021-11-10 17:26:45 发布

阅读量105

点赞数

本文链接：https://blog.csdn.net/weixin_41429815/article/details/114833549

版权

视频分类

LRCN，性能不突出，方法具有开拓性。
ActionVLAD，视频类别由多个局部片段的行为/事件组成，图像序列和光流序列分别提取特征，特征拼接再融合分类（多实例学习是否可以加入其中）
Attention Cluster

小结：CNN提取静态视觉信息，特征平均/LSTM/特征拼接/聚类建模不同视频帧之间的时序关系；结合视频特点设计更精细的网络结构，不断提升分类精度
- 多层次信息
- attention

主要工作：采用跨模态只是蒸馏技术，在静态图像网络中encode运动信息；仅输入图像序列的情况下，可提取运动相关特征，取得更好结果；避免了复杂的光流计算，极大节约了计算时间。

训练加速：
挂在成熟模块
避免使用复杂光流计算
测试加速
轻量级主干网
设计轻量化的视频分类模型
引入新的信息模态（如：人体关键点分布）
空间：图模型建模人土不同部位，人与物体的关系；时序：建模目标的中高层语义变化（如形状）
引入刻画人体不同部位的动态骨架图，构建图模型。

关注