基于OMP的L1跟踪算法

http://hi.baidu.com/windey1988/item/f711702c5d187b4e46996289

简单总结一下CVPR11年一篇改进L1跟踪算法的文章,即Real-time Visual Tracking Using Compressive Sensing

    先提一提ICCV09年这篇L1跟踪算法的,即Robust visual tracking using L1 minimization。这篇原始的L1跟踪算法的文章首先将Yi Ma成功用在人脸识别上面的稀疏表示引入到视觉跟踪中,加上粒子滤波的框架,就可以work了。算法的大致流程如下:

    第一帧时设定初始跟踪位置,根据设定的初始化位置采样10个模板,再加上一个单位180维单位矩阵(对应180个平凡模板)组成一个190维的模板集。初始化10维权值向量,用于模板的更新。

    从第二帧开始,采样粒子,对每个粒子求稀疏表示,保证稀疏系数非负。最稀疏的粒子就对应着预测的位置。同时根据当前预测的目标同模板的距离来更新权值,权值足够小则用当前预测目标替换掉该模板。

    然后不断逐帧跟踪。

    这篇文章有个亮点就是在粒子滤波框架中同时加入了一个仿射变换的运动模型。使得算法跟踪的是平行四边形的目标。大多数跟踪算法为了简易起见,都是使用矩形框来定位目标。


    改进的文章大致有三个创新点。第一个是将OMP(正交匹配追踪)用于求解L1,大大减少了计算量。第二个是提出了背景模型,提高了算法的鲁棒性。第三个是提出了自己的跟踪算法准确性度量。

    这里的L1问题如下:

    压缩感知强调的是“压缩”。大概就是使用一组过完备的基,以远远低于抽样定理的频率采样到测量信号。同时只要测量矩阵满足RIP条件,那么我们就可以重构出原始信号。

压缩感知的重要用途就是计算机断层扫描。可以根据扫描得到的不太清晰的图像重构出高清晰度的图像,用在医学上。

    论文中提到引入了压缩感知,就在于加入了一个满足RIP条件的随机观测矩阵。原始论文中直接根据初始位置得到180维图像信息。若目标过大时,将会损失掉大量的图像信息。这里引入随机观测矩阵降维,不会造成太大的信息损失,同时增加了算法的准确性,减少了大量计算量。

    采用OMP代替Lasso算法求解稀疏表示。OMP全称是正交匹配追踪,其求解思路采用的是贪心策略。总是选取与待匹配信号内积最大的那个基加入解集合中,用最小二乘法拟合求得残差,再对残差进行同样的处理,直到残差足够小或者达到一定的迭代次数。

    同样,作者引入了背景模型。原始的那篇L1没有考虑背景,一个很大的假设就是使用噪声模板(平凡模板)可以有效地重构候选采样点。实际上,当采样点属于背景时根本无法求得其稀疏表示。而引入背景模型就不同了,有了背景模型,不管是前景目标还是背景我们都可以得到足够稀疏的系数。背景模型是如何得到的呢?在初始目标的周围采样得到。算法中粒子的权值与其重构的残差相对应,残差最小的那个粒子就对应预测目标。根据粒子的权值选择性地更新目标模板。

    论文同样提出了一个新的跟踪精确性度量,原始的度量一般采用的是真实状态的中心位置和预测目标的中心位置的距离。现在改为考虑真实区域和预测区域的重叠面积。

    总结,算法经过改进后基本可以达到实时,同时和原始算法的准确性大致相当。引入背景模型后大大提高了其准确性


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
RPCA-OMP算法是一种基于稀疏表示的图像融合算法,可以用于将多幅图像融合成一幅高质量的图像。下面是基于RPCA-OMP算法的图像融合matlab代码: ```matlab clear all; clc; %读入图像 img1=imread('img1.jpg'); img2=imread('img2.jpg'); img3=imread('img3.jpg'); %图像融合 [X,~,~]=RGB2YIQ(img1); [Y,~,~]=RGB2YIQ(img2); [Z,~,~]=RGB2YIQ(img3); lambda=1/sqrt(max(size(X)));%参数&lambda; alpha=5;%参数α beta=1;%参数β Y_fused=RPCA_OMP(X,Y,Z,alpha,beta,lambda); %显示结果 imshow(Y_fused,[]); ``` 其中,RGB2YIQ是一个将RGB图像转换为YIQ图像的函数,RPCA_OMP是基于RPCA-OMP算法的图像融合函数,具体代码如下: ```matlab function [Y_fused]=RPCA_OMP(X,Y,Z,alpha,beta,lambda) %输入:X,Y,Z为三个待融合图像,alpha, beta, lambda为算法参数 %输出:Y_fused为融合后的图像 %参数设置 maxIter = 30; tol = 1e-4; n1=size(X,1);%图像高 n2=size(X,2);%图像宽 n3=size(X,3);%图像通道数 N=n1*n2;%图像像素数 %将图像拉成向量 X_vec=reshape(X,N,n3); Y_vec=reshape(Y,N,n3); Z_vec=reshape(Z,N,n3); %构造数据矩阵 D=[X_vec';Y_vec';Z_vec']; %RPCA-OMP算法 E = zeros(size(D)); S = zeros(size(D)); A = zeros(size(D)); for k = 1 : size(D,2) %OMP算法求解系数矩阵A r = D(:,k); supp = []; a = zeros(size(D,2),1); for iter = 1:maxIter res = r - D(:,supp)*a(supp); [~,idx] = max(abs(D'*res)); supp = [supp,idx]; a(supp) = D(:,supp)\r; if norm(r-D(:,supp)*a(supp))/norm(r) < tol break; end end %更新图像矩阵E和稀疏矩阵S E(:,k) = D(:,k) - D*a; S(:,k) = a; end %RPCA算法求解低秩矩阵L和稀疏矩阵S [L,S,~] = inexact_alm_rpca(E,beta/lambda); %图像重构 Y_fused_vec = L(:) + S(:); Y_fused = reshape(Y_fused_vec,n1,n2,n3); Y_fused = YIQ2RGB(Y_fused);%将YIQ图像转换为RGB图像 end ``` 其中,inexact_alm_rpca是基于RPCA的算法函数,主要用于求解低秩矩阵L和稀疏矩阵S,具体代码如下: ```matlab function [L,S,iter] = inexact_alm_rpca(X,lambda) %输入:X为待分解矩阵,lambda为算法参数 %输出:L为低秩矩阵,S为稀疏矩阵,iter为迭代次数 %参数设置 tol = 1e-7; maxIter = 1000; [m,n] = size(X); rho = 1.1; mu = 1e-5; %初始化矩阵 L = zeros(m,n); S = zeros(m,n); Y = zeros(m,n); %计算矩阵的核范数 normX = norm(X,'fro'); normOne = norm(X,1); normInf = norm(X,inf)/lambda; dual_norm = max(normOne,normInf); %迭代求解 iter = 0; while iter < maxIter iter = iter + 1; %更新S矩阵 S = prox_l1(X - L + (1/mu)*Y,1/mu); %更新L矩阵 [U,~,V] = svd(X - S + (1/mu)*Y,'econ'); diagS = diag(S); threshold = mu/dual_norm; diagS = soft_threshold(diagS,threshold); r = sum(diagS > 0); L = U(:,1:r)*diag(diagS(1:r))*V(:,1:r)'; %更新Y矩阵 leq1 = X - L - S; Y = Y + mu*leq1; mu = min(mu*rho,1e10); %检查收敛性 stopCriterion = norm(leq1,'fro')/normX; if stopCriterion < tol break; end end end %软阈值函数 function [y] = soft_threshold(x,tau) y = sign(x).*max(abs(x) - tau,0); end %L1范数投影函数 function [y] = prox_l1(x,gamma) y = sign(x).*max(abs(x) - gamma,0); end %RGB转YIQ函数 function [Y,I,Q] = RGB2YIQ(R,G,B) Y = 0.299*R + 0.587*G + 0.114*B; I = 0.596*R - 0.274*G - 0.322*B; Q = 0.211*R - 0.523*G + 0.312*B; end %YIQ转RGB函数 function [R,G,B] = YIQ2RGB(Y,I,Q) R = Y + 0.956*I + 0.621*Q; G = Y - 0.272*I - 0.647*Q; B = Y - 1.106*I + 1.703*Q; end ``` 上述代码实现了基于RPCA-OMP算法的图像融合,可以将多幅图像融合成一幅高质量的图像。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值