基于深度学习的行为识别框架和注意力机制的总结

2DCNN

Two-stream
TSN
TSM:惊艳,领会精神了,还没认真读。
Inception
Resnet

3DCNN

C3D
I3D
S3D
可以由很强的2D 架构拓展而来

(2+1)D

R(2+1)D

注意力机制

SENET : channel-wise attention
SKNET: channel-wise+selective RFs
NON-local: self-attention

Transformer

经典架构:Attention is all you need
ViT
BERT:用于处理长文本,但segment之间不能交流就很伤
transformer XL: 用于处理长文本,解决了segment之间不能交流的问题。但只能单向交流,很伤。
Longformer: 用于处理长文本,解决了transformer xl只能单向交流的问题。

VTN(2021):利用CNN提取视频特征,用基于Longformer的结构处理长视频。代码还未开源。草

video action transformer network(2019的oral):用于处理时长较短的数据集,如AVA, 只有三秒,标记其中的一个关键帧。文章用I3D抽取特征,在中间层把数据拿出来,将中间的帧作为关键帧,用RPN选出300个物体框,经过ROIPool把框size统一,然后用Qpr处理人物的框。这里Qpr有两种方法,一种是直接全局平均池化,一种是将ROI分的块CAT起来(存疑)。经过处理后,人物框复制与帧同样多份,以便同时对多帧querry。之后就是应用多头机制,与attentionisallyouneed几乎一样的结构。论文效果很好,但想了想参数量很高。如果要应用在其他数据集上,可以将RPN部分去掉。

近期准备复习一下这些论文,再更。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
利用骨骼进行的人体行为识别, 基于LOP 的行为识别,可以运行 (action recognition) 文件列表: actionletEnsemble-master actionletEnsemble-master\.gitignore actionletEnsemble-master\LICENSE actionletEnsemble-master\MSRAction3D actionletEnsemble-master\MSRAction3D\MSRAction3D_skeleton_features.mat actionletEnsemble-master\MSRAction3D\evaluate_on_MSR_action_3D.m actionletEnsemble-master\MSRDailyActivity3D actionletEnsemble-master\MSRDailyActivity3D\configDailyAcitity.m actionletEnsemble-master\MSRDailyActivity3D\evaluate_on_MSR_DailyAcitivity3D.m actionletEnsemble-master\MSRDailyActivity3D\extractAllLopFeatures.m actionletEnsemble-master\MSRDailyActivity3D\extractAllSkeletonFeatures.m actionletEnsemble-master\MSRDailyActivity3D\processOneSkeleton.m actionletEnsemble-master\MSRDailyActivity3D\trainClassifier.m actionletEnsemble-master\README.md actionletEnsemble-master\feature actionletEnsemble-master\feature\computeMotionField.m actionletEnsemble-master\feature\computePairwiseJointPositions.m actionletEnsemble-master\feature\computeSOPFeaturesSkeleton.m actionletEnsemble-master\feature\compute_motion_descriptors.m actionletEnsemble-master\feature\compute_motion_maps.m actionletEnsemble-master\feature\fftPyramid.m actionletEnsemble-master\feature\getSopFeature.m actionletEnsemble-master\feature\lopFeature.m actionletEnsemble-master\feature\lopFeatureSkeleton.m actionletEnsemble-master\feature\sopFeatureSkeleton.m actionletEnsemble-master\setup_path.m actionletEnsemble-master\util actionletEnsemble-master\util\ComputeMotion.mexw64 actionletEnsemble-master\util\ReadDepthBin.mexa64 actionletEnsemble-master\util\ReadDepthBin.mexw64 actionletEnsemble-master\util\iSaveX.m actionletEnsemble-master\util\normalizeFeature.m actionletEnsemble-master\util\predict.mexa64 actionletEnsemble-master\util\readDepthBin.m actionletEnsemble-master\util\readSkeleton.m actionletEnsemble-master\util\train.mexa64
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值