CVPR2019 action detection 动作检测论文 two-in-one算法学习笔记

Dance with Flow: Two-in-One Stream Action Detection

学习时,别忘了总是要问自己一个为什么


论文

文章: Dance with Flow: Two-in-One Stream Action Detection
连接: https://arxiv.org/abs/1904.00696

简介

Two-in-One Stream Action Detection (以下简称 two-in-one) 提出了一种新layer 从而结合 RGB图像与optical-flow 图像.

  • motion condition layer 从 of图像中提取动作信息
  • motion modulation layer 利用mcl层信息来生成调制RGB特征的变换参数

实验证实利用 motion condition 去调制 RGB特征可以提高检测的准确率.在网络参数比soa少一般参数的情况下,仍达到了很高的正确率.
使用的数据集:

UCF101-24, UCFSports and J-HMDB.

方法

1. 主体

Two-in-One 网络结构极其简单.

motion condition layer 从光流图中提取先验条件信息,再把条件信息传入到modulation layer 进行特征融合.
可以看出来想法其实很简单:

  1. 提 optical flow 的特征
  2. 融合进RGB特征里

没了

  • 所以,这里可以抛出第一个疑问, 为什么optical flow 经过几层卷积提特征就可以得到想要的prior condition, 并称这种特征层叫motion condition layer?
2. motion condition

我认为本文最好的点有两个:

  • 第一个就在于提出motion condition. 因为它给一些模棱两可的图方向性的指引,他会guide 模型去pay more attention on what moves. 如图所示

本质的讲,其实就是更好的提取了optical flow 中包含的时序性的,动态的信息. 相当于motion condition 提供了动作的attention, 如 果attention在object的上方区域,就代表了object的移动趋势是向上的,如果attention在object的下方,代表了object的移动趋势是向下的. 模型通过学习这额外的attention,就可以更好的预测动作.所以这是有利于对action的分类

  • 第二个我认为在于transform 映射,怎样把optical flow 中有用的信息映射到 rgb 特征中
3. 算法
  1. Motion condition layer
    ( L ↦ , S ↦ ) = D θ ↦ ( I r g b ∣ Ψ ) (L^{\mapsto},S^{\mapsto})= D^{\mapsto}_{\theta}(I^{rgb}|\Psi) (L,S)=Dθ(IrgbΨ)
    Ψ = M C ( I 0 f ) = M C ( ( I o f x , I o f y ) ) \Psi=MC(I^{0f})=MC((I^{of_x},I^{of_y})) Ψ=MC(I0f)=MC((Iofx,Iofy))
    Ψ \Psi Ψ 视为 I o f I^{of} Iof中提取的先验信息, L ↦ , S ↦ L^{\mapsto}, S^{\mapsto} L,S 可以分别视为合并信息之后的location 输出和 class 输出, D θ ↦ D^{\mapsto}_{\theta} Dθ则可以视为合并的网络.
  2. Motion modulation layer
    M 2 ( F r g b ) = β ⊙ F r g b + γ M^2(F^{rgb})=\beta\odot F^{rgb}+\gamma M2(Frgb)=βFrgb+γ
    我们的目的其实是从 Ψ \Psi Ψ 中学习仿射变换的参数 ( β , γ ) (\beta,\gamma) (β,γ),然后图一中的调制模型部分 M 2 M^2 M2可视为对rgb图像 F r g b F^{rgb} Frgb的映射变换.
    这种modulation layer 可以加在各个bottom layer的后面.

累了,改天再写, 未完待续 - - -

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值