Paper Reading:Exploiting the Circulant Structure of Tracking-by-detection with Kernels

论文链接:http://120.52.51.15/www.robots.ox.ac.uk/~joao/publications/henriques_eccv2012.pdf

摘要

阐述近年来开始使用判别器在跟踪系统中,并在目标跟踪上取得成功。由于该方法采用线上实时训练过程中采集样本点的方式,大规模的样本数会造成计算资源和实时性之间的冲突。与此同时适当删减样本数量也会导致跟踪效果变差。本文采用循环结构来解决上述问题,主要思路如下:(1)采用快速傅里叶变换进行快速学习和检测;(2)用核方法来代替以往的线性分类器,可供选择的核方法有:多项式核和高斯核; 最后本文所述方法实现了与当前先进技术可媲美的效果,并且代码量少,每秒可运行的帧数多(接近一百)

 

第一部分 介绍

论文比较方法

SVM

自适应相关滤波器

MOSSE

 

本文贡献之处

  1. 提出一种叫稠密采样的方法
  2. 证明对于单位不变核,核矩阵满足循环结构
  3. 该方法速度快并精确,计算复杂度仅为O(n2logn
  4. 核正则最小平方损失;使用通用的核分类器检测所有子窗口;在所有子窗上测试一系列核方法的不同效果
  5. 提出一种与以上学习和检测策略相匹配的跟踪器,并提供MATLAB源码
  6.  

第二部分 稠密采样过程中的学习环节

2.1 提出正则化的最小化损失函数

2.2 阐述循环矩阵的重要性质之一

2.3 核矩阵使用稠密采样

理论一:

 

推论一:

2.4有效核的正则化最小平方解决方案

提出的算法复杂度只有O(n2logn),而朴素的KRLS方法的复杂度有O(n4)

2.5 快速检测

一般分类器的输出为:

本文所提出方法的输出:

第三部分 非线性核方法的快速计算

指出在处理时序相关问题比如跟踪时,线性核方法更被青睐,非线性核方法无法明确的表示计算,已有的较好解决该问题的非线性核方法要求先对获取到的数据进行归一化,而这个过程会损失重要的信息。

在这项工作中,我们提出了封闭形式的解决方案,以一种充分利用问题结构的有效方式计算所有图像位置的各种内核。公式精确,并且易于计算。

3.1 点乘核及其对应推导

3.2径向基核函数

同时指出直接在空间域使用核方法计算复杂度为O(n4),在频域使用核方法相应复杂度为O(n2logn)。

第四部分 实验环节

4.1算法流程:

1、进行预处理,利用余弦窗消除边界效应

2、利用Loss Function估计最大响应目标位置

3、进行新一轮的学习,更新系数

4.2预处理

其他常用消除边界效应的方法:延拓处理

余弦窗表达式:

作用效果:令靠近边界的值接近零。

4.3训练输出

效果:连续的标签值产生空间平滑的分类响应,从而产生比二值标签更精确的位置估计

4.4MATLAB源码

第五部分 提出算法的使用效果

算法效果极好,不输于MOSSE2,同时速度快,每秒能运行几百帧。该效果的取得依赖于闭环形式,线上训练、检测和跟踪以及非线性核方法的使用(快速傅里叶变换、循环矩阵机制、正则化、单位核不变、预处理消除边界效应、连续预测值的产生)

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值