在本文中,稀疏表示的原理不再具体讲解,有需要的同学请自行百度。
本文采用OMP算法来求解稀疏系数。首先随机生成字典数据和待测试数据
字典数据:
dic =[
6, 7, 9, 9, 7, 0, 6, 3, 6, 9;
1, 8, 7, 8, 5, 3, 8, 1, 7, 3;
3, 3, 5, 4, 8, 2, 6, 1, 2, 2;
6, 1, 0, 7, 3, 5, 0, 6, 3, 3;
7, 5, 0, 5, 3, 0, 2, 7, 1, 7];
这是一个5*10的矩阵,行数代表维度,列数代表样本数。列数在字典中也叫字典原子,此处有10个原子,原子数大于维数,符合过完备要求。
信号数据:
signal=[ 9; 8; 8; 3; 9];
为了简便,只模拟了一个信号数据,是一个5*1的矩阵,如果有多个数据,则应该是5*n的矩阵。求解的时候,可用循环求解。
一、在matlab中实现稀疏表示,求解稀疏系数
clc;close all;clear all;
dic =[
6, 7, 9, 9, 7, 0, 6, 3, 6, 9;
1, 8, 7, 8, 5, 3, 8, 1, 7, 3;
3, 3, 5, 4, 8, 2, 6, 1, 2, 2;
6, 1, 0, 7, 3, 5, 0, 6, 3, 3;
7, 5, 0, 5, 3, 0, 2, 7, 1, 7]; %字典
signal=[ 9; 8; 8; 3; 9]; %原始信号
dic=dic*diag(1./sqrt(sum(dic.^2))); %字典原子单位化,即每列的norm为1
signal=signal/norm(signal); %信号单位化
[A,res]=OMP(dic,signal,6); %稀疏度设定为6,即非零元素最多为6个
A %输出系数
res %输出残差
epsilon=norm(signal-dic*A) %验证残差 ||Y-Dx||2
其中OMP算法:
%OMP计算稀疏系数
function [A,res]=OMP(D,X,L)
% 输入参数:
% D - 过完备字典,注意:必须字典的各列必须经过了规范化
% X - 信号
% L - 稀疏度,系数中非零元个数的最大值
% 输出参数:
% A - 当前信号的系数
% res - 残差
%%
residual=X; %初始化残差
indx=zeros(L,1);
for i=1:L,
proj=D'*residual;%D转置与residual相乘,得到与residual与D每一列的内积值
[~,pos]=max(abs(proj));%找到内积最大值的位置
pos=pos(1);%若最大值不止一个,取第一个
indx(i)=pos;%将这个位置存入索引集的第j个值
a=pinv(D(:,indx(1:i)))*X;%indx(1:j)表示第一列前j个元素
residual=X-D(:,indx(1:i))*a;
res=norm(residual);
if res< 1e-6
break;
end
end
A=zeros(size(D,2),1);
A(indx(indx~=0))=a;
end
结果:
A =
0.1450
0.9391
0
0
0.4210
0.1049
0
0
-0.5503
0
res =
3.1402e-16
epsilon =
3.1402e-16
从系数中可以看出,从10个原子共选出了5个原子进行表示,最后的残差非常小,说明稀疏表示的结果和原数据非常接近。基于纹理特征的稀疏表示分类
二、在opencv2中实现稀疏表示
void getData(Mat &data, Mat &signal);
int main(int argc, char* argv[])
{
Mat dic, signal;
getData(dic, signal); //获取模拟数据
Mat temp(1, dic.cols, CV_32F); //用一个矩阵保存每个原子的模长
for (int i = 0; i<dic.cols; i++)
{
temp.col(i) = norm(dic.col(i)); //每个原子的模长
}
divide(dic, repeat(temp, dic.rows, 1), dic); //字典原子单位化
signal = signal / norm(signal); //信号单位化
Mat A=src.OMP(dic, signal, 8); //调用OPM求解
float res =(float)norm(signal - dic*A); //计算残差
cout << "系数:" <<endl<< A << endl;
cout<<endl<<"残差:"<< endl<<res << endl; //输出残差
waitKey(0);
return 0;
}
void getData(Mat &dic, Mat &signal)
{
dic = (Mat_<float>(5, 10) <<
6, 7, 9, 9, 7, 0, 6, 3, 6, 9,
1, 8, 7, 8, 5, 3, 8, 1, 7, 3,
3, 3, 5, 4, 8, 2, 6, 1, 2, 2,
6, 1, 0, 7, 3, 5, 0, 6, 3, 3,
7, 5, 0, 5, 3, 0, 2, 7, 1, 7);
signal = (Mat_<float>(5, 1) << 9, 8, 8, 3, 9);
}
其中,OMP函数为:
Mat SRC::OMP(Mat& dic, Mat& signal,int sparsity)
{
if (signal.cols>1)
{
cout << "wrong signal" << endl;
exit(-1);
}
vector<int> selectedAtomOrder; //保存所有选出的字典原子序号
Mat coef(dic.cols, 1, CV_32F, Scalar::all(0)); //需要返回的系数
Mat residual = signal.clone(); //初始化残差
Mat indx(0, 1, CV_32F);//初始化临时系数
Mat phi; //保存已选出的原子向量
float max_coefficient;
unsigned int atomOrder; //每次所选择的原子的序号
for (;;)
{
max_coefficient = 0;
//取出内积最大列
for (int i = 0; i <dic.cols; i++)
{
float coefficient = (float)dic.col(i).dot(residual);
if (abs(coefficient) > abs(max_coefficient))
{
max_coefficient = coefficient;
atomOrder = i;
}
}
selectedAtomOrder.push_back(atomOrder); //添加选出的原子序号
Mat& temp_atom = dic.col(atomOrder); //取出该原子
if (phi.cols == 0)
phi = temp_atom;
else
hconcat(phi, temp_atom, phi); //将新原子合并到原子集合中(都是列向量)
indx.push_back(0.0f); //对系数矩阵新加一项
solve(phi, signal, indx, DECOMP_SVD); //求解最小二乘问题
residual = signal - phi*indx; //更新残差
float res_norm = (float)norm(residual);
if (indx.rows >= sparsity || res_norm <= 1e-6) //如果残差小于阈值或达到要求的稀疏度,就返回
{
for (int k = 0; k < selectedAtomOrder.size(); k++)
{
coef.row(selectedAtomOrder[k]).setTo(indx.row(k)); //得到最终的系数
}
return coef;
}
}
}
最终输出结果为:
系数:
[0.14503297;
0.9391216;
0;
0;
0.42096639;
0.1048916;
0;
0;
-0.55029994;
0]
残差:
1.70999e-007
看以看出,opencv得到的系数和matlab得到的系数基本是一样,只是小数点后保留的位数区别。因为小数位数不相同,所以最后残差有点不同,但不影响最终结果,我们只需要系数相同即可。