基于OMP的L1跟踪算法

最新推荐文章于 2020-01-07 21:21:00 发布

baijingjing425

最新推荐文章于 2020-01-07 21:21:00 发布

阅读量2k

点赞数

分类专栏：粒子滤波视频

粒子滤波同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

http://hi.baidu.com/windey1988/item/f711702c5d187b4e46996289

简单总结一下CVPR11年一篇改进L1跟踪算法的文章，即Real-time Visual Tracking Using Compressive Sensing。

先提一提ICCV09年这篇L1跟踪算法的，即Robust visual tracking using L1 minimization。这篇原始的L1跟踪算法的文章首先将Yi Ma成功用在人脸识别上面的稀疏表示引入到视觉跟踪中，加上粒子滤波的框架，就可以work了。算法的大致流程如下：

第一帧时设定初始跟踪位置，根据设定的初始化位置采样10个模板，再加上一个单位180维单位矩阵（对应180个平凡模板）组成一个190维的模板集。初始化10维权值向量，用于模板的更新。

从第二帧开始，采样粒子，对每个粒子求稀疏表示，保证稀疏系数非负。最稀疏的粒子就对应着预测的位置。同时根据当前预测的目标同模板的距离来更新权值，权值足够小则用当前预测目标替换掉该模板。

然后不断逐帧跟踪。

这篇文章有个亮点就是在粒子滤波框架中同时加入了一个仿射变换的运动模型。使得算法跟踪的是平行四边形的目标。大多数跟踪算法为了简易起见，都是使用矩形框来定位目标。

改进的文章大致有三个创新点。第一个是将OMP（正交匹配追踪）用于求解L1，大大减少了计算量。第二个是提出了背景模型，提高了算法的鲁棒性。第三个是提出了自己的跟踪算法准确性度量。

这里的L1问题如下：

压缩感知强调的是“压缩”。大概就是使用一组过完备的基，以远远低于抽样定理的频率采样到测量信号。同时只要测量矩阵满足RIP条件，那么我们就可以重构出原始信号。

压缩感知的重要用途就是计算机断层扫描。可以根据扫描得到的不太清晰的图像重构出高清晰度的图像，用在医学上。

论文中提到引入了压缩感知，就在于加入了一个满足RIP条件的随机观测矩阵。原始论文中直接根据初始位置得到180维图像信息。若目标过大时，将会损失掉大量的图像信息。这里引入随机观测矩阵降维，不会造成太大的信息损失，同时增加了算法的准确性，减少了大量计算量。

采用OMP代替Lasso算法求解稀疏表示。OMP全称是正交匹配追踪，其求解思路采用的是贪心策略。总是选取与待匹配信号内积最大的那个基加入解集合中，用最小二乘法拟合求得残差，再对残差进行同样的处理，直到残差足够小或者达到一定的迭代次数。

同样，作者引入了背景模型。原始的那篇L1没有考虑背景，一个很大的假设就是使用噪声模板（平凡模板）可以有效地重构候选采样点。实际上，当采样点属于背景时根本无法求得其稀疏表示。而引入背景模型就不同了，有了背景模型，不管是前景目标还是背景我们都可以得到足够稀疏的系数。背景模型是如何得到的呢？在初始目标的周围采样得到。算法中粒子的权值与其重构的残差相对应，残差最小的那个粒子就对应预测目标。根据粒子的权值选择性地更新目标模板。

论文同样提出了一个新的跟踪精确性度量，原始的度量一般采用的是真实状态的中心位置和预测目标的中心位置的距离。现在改为考虑真实区域和预测区域的重叠面积。

总结，算法经过改进后基本可以达到实时，同时和原始算法的准确性大致相当。引入背景模型后大大提高了其准确性

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
基于OMP的L1跟踪算法

http://hi.baidu.com/windey1988/item/f711702c5d187b4e46996289简单总结一下CVPR11年一篇改进L1跟踪算法的文章，即Real-time Visual Tracking Using Compressive Sensing。先提一提ICCV09年这篇L1跟踪算法的，即Robust visual tracking
复制链接

扫一扫

专栏目录

baijingjing425 CSDN认证博客专家 CSDN认证企业博客

码龄16年

6: 原创

31万+: 周排名

56万+: 总排名

10万+: 访问

: 等级

1221: 积分

44: 粉丝

8: 获赞

23: 评论

49: 收藏

私信

关注

热门文章

分类专栏

最新评论

流形学习 manifold learning--自学小结（2）之 Isomap
新生小屋: 你好，我目前正在做基于流形学习的手势识别这一块。我想问一下，swiss_roll_data.mat中的X_data和Y_data分别表示什么，有什么用途，poses向量如何得到，关键是，怎么将手势图片转化成矩阵作为识别系统的输入呢？？？我对这一块现在很迷茫，希望帮我一下，我的QQ号是755738155，谢谢。。。
流形学习 manifold learning--自学小结（2）之 Isomap
新生小屋: 你好，我目前正在做基于流形学习的手势识别这一块。我想问一下，swiss_roll_data.mat中的X_data和Y_data分别表示什么，有什么用途，poses向量如何得到，关键是，怎么将手势图片转化成矩阵作为识别系统的输入呢？？？我对这一块现在很迷茫，希望帮我一下，我的QQ号是755738155，谢谢。。。
以太网上TCP/IP协议的分层结构及其报文格式
sunyaofei: 很好，讲得很形象
和机器学习和计算机视觉相关的数学
baijingjing425: http://chillyrain.is-programmer.com/tag/%E7%BB%B4%E6%95%B0%E7%81%BE%E9%9A%BE
流形学习 manifold learning--自学小结（1）
baijingjing425: matlab demo http://www.math.ucla.edu/~wittman/mani/index.html

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。