算法学习 -- Staple: Complementary Learners for Real-Time Tracking

Abstract

一个结合梯度特征HOG及颜色特征的实时跟踪算法,速度达到80FPS,即每秒80帧图像。

Introduction

Staple: Sum of Template And Pixel-wise LEarners
对于目前的主流跟踪算法,采用的tracking-by-detection策略,即先检测目标的位置,以HOG检测为例 ,对同一个目标,可能得到多个目标的矩形框,如下图所示。有的时候直接通过NMS(non-maximum suppression 非极大值抑制)处理保证只有一个解。不过多数跟踪算法宁可错杀,也不愿放过一个。HOG Object Detection 可以参考 Histogram of Oriented Gradients and Object Detection
在这里插入图片描述

Related Work

  1. Online learning and Correlation Filters:在线学习+协同过滤
  2. Robustness to deformation:应对形变
  3. Schemes to reduce model drift:应对漂移问题
  4. Combining multiple estimates:结合多种估计
  5. Long-term tracking with re-detection:长期跟踪及重复检测

Proposed Approach

符号及含义

  1. t t t frame index, 帧索引,帧下标
  2. x t x_t xt 第t帧图像, x x x指代任意一帧图像
  3. p t p_t pt 第t帧图像中目标对应的矩形,当然,这个是最优的, p p p指代任意一帧图像
  4. S t S_t St 第t帧图像中目标对应的所有矩形,所以我们有 p t = a r g m a x p ∈ S t f ( T ( x t , p ) ; θ t − 1 ) p_t=argmax_{p\in S_t}f(T(x_t,p);\theta _{t-1}) pt=argmaxpStf(T(xt,p);θt1)
  5. f ( T ( x , p ) ; θ ) f(T(x,p);\theta) f(T(x,p);θ) 依据模型参数 θ \theta θ,计算得到目标在图像 x x x对应矩形 p p p的分数(score)。这个分数当然是越高越好,所以选择取最大分数时的矩形 p p p作为最优的矩形 p t p_t pt。对于 T ( x , p ) T(x,p) T(x,p)可以暂时肤浅地理解为检测出来的梯度特征与颜色特征。同样参数 θ \theta θ也可以暂时肤浅地理解为预测的梯度特征与颜色特征。然后 f ( T ( x , p ) ; θ ) f(T(x,p);\theta) f(T(x,p);θ)求预测特征与检测特征之间的匹配的情况,匹配分数越高,就越可能对应实际的目标矩形 p t p_t pt<
  • 7
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值