最近看STRCF算法,这是一个克服遮挡和大幅形变的实时视觉追踪算法。这篇论文的主要贡献如下:
- 通过将空间和时间正则化纳入 DCF 框架,提出了 STRCF 模型。基于在线 PA 的 STRCF 不仅可以合理地逼近多幅训练图像上的 SRDCF 形式,而且在较大的外观变化情况下比 SRDCF 具有更强的鲁棒性。
- 为高效求解 STRCF,开发了一种 ADMM 算法,其中每个子问题都有封闭形式的解。并且本文提出的算法可以在非常少的迭代中经验地收敛。
- 本文提出的 STRCF 具有人工设计的特征,可以实时运行,相比 SRDCF 在准确率上有了显著的提升。此外,STRCF 与最先进的追踪器 [9,15] 相比,性能良好。
论文中反复提到STRCF算法是在线被动攻击学习(PA)算法的扩展,于是我找来了PA算法的论文,一篇2006年发表的古老的论文。
问题
符号 | 表示 |
---|---|
xt x t | n维向量,第t次循环中的输入实例 |
yt y t | xt x t 对于的类标,取值为+1,-1 |
(xt,yt) ( x t , y t ) | 实例-类标对,也叫一个示例 |
w | n维权重向量 |
|w⋅x| | w ⋅ x | | 预测置信度 |
yt(wt⋅xt) y t ( w t ⋅ x t ) | 第t次循环中(有符号的)边际利润 |
当边际利润margin是正数时, sign(wt⋅xt)=yt s i g n ( w t ⋅ x t ) = y t ,这时算法预测正确。然而,我们不满足于一个正边际利润值,我们还希望算法能有很高的预测置信度。于是,算法的目标是尽可能经常实现一个最少是1的边际利润,在每次循环中当边际利润小于1时就会有一个瞬间损失。这就是所谓的hinge损失函数:
l(w;(x,y))={
01−y(w⋅x)y(w⋅x)≥1otherwise(1) l ( w ; ( x , y ) ) = { 0 y ( w ⋅ x ) ≥ 1 1 − y ( w ⋅ x ) o t h e r w i s e ( 1 )
解释:当边际利润>1时,损失值=0,否则等于1和边际利润之间的差值。注意到,选择1作为边际阈值其实是相当随意的。所以后面在解决回归问题时,作者又将hinge损失函数推广到一般化,将这个边际阈值作为一个用户输入的参数。
记 lt=l(wt;(xt,yt)) l t = l ( w t ; ( x t , y t ) ) ,本文给出的算法将被证明在给定的示例序列中获得一个小的累积平方损失,即作者能证明在 ∑Tt=1l2t ∑ t = 1 T l t 2 上不同的界限,其中T是序列的长度。注意到当有一个预测错误出现时, l2t≥1 l t 2 ≥ 1 ,因此累积平方损失的界限也限制在示例序列中错误预测的数量。
二分类算法
本节作者给出了二分类问题在线学习算法的三种变体。这三种变体的 w1