RANSAC在图像拼接中有所使用,有时候也在图像理解的相关算法中有所使用。
算法简介如下(摘自《图像处理、分析与机器视觉(第3版)》):
1.假设我们要将n个数据点X={x1,x1,...,xn}拟合为一个由至少m个点决定的模型(m<=n,对于直线,m=2)。(我这里实际是两个不同均值、协方差高斯分布产生的数据)
2.设迭代计数k=1。
3.从X中随机选取m个项并拟合一个模型。(我这里直线拟合,选了2个项)
4.给定偏差ε,计算X中相对于模型的残差在偏差ε的个数,如果元素个数大于一个阈值t,根据一致点集重新拟合模型(可以利用最小二乘或其变种),算法终止。(我这里的偏差为1,阈值为数据个数的2/3)
5.设k=k+1,如果k小于一个事先给定的K,跳至第3步,否则采用具有迄今最大的一致点集模型,或算法失败。
运行效果如下,红圈是所有的数据,蓝叉是符合拟合模型的数据。
matlab代码如下:
main.m
close all;clear all;clc; %真实的数据 mu=[0 0]; %均值 S=[1 2.5;2.5 8]; %协方差 data1=mvnrnd(mu,S,200); %产生200个高斯分布数据 %噪声数据 mu=[2 2]; S=[8 0;0 8]; data2=mvnrnd(mu,S,100); %产生100个噪声数据 data=[data1;data2]; plot(data(:,1),data(:,2),'ro'); %显示全部数据 K=100; %设置最大迭代次数 sigma=1; %设置拟合直线与数据距离的偏差 pretotal=0; %符合拟合模型的数据的个数 k=1; while pretotal < size(data,1)*2/3 && k<K %有2/3的数据符合拟合模型或达到最大迭代次数就可以退出了 SampIndex=floor(1+(size(data,1)-1)*rand(2,1)); %产生两个随机索引,找样本用,floor向下取整 samp1=data(SampIndex(1),:); %对原数据随机抽样两个样本 samp2=data(SampIndex(2),:); line=Mytls([samp1;samp2]); %对两个数据拟合出直线,或其他变种拟合方法 mask=abs(line*[data ones(size(data,1),1)]'); %求每个数据到拟合直线的距离 total=sum(mask<sigma); %计算数据距离直线小于一定阈值的数据的个数 if total>pretotal %找到符合拟合直线数据最多的拟合直线 pretotal=total; bestline=line; %找到最好的拟合直线 end k=k+1; end %显示符合最佳拟合的数据 mask=abs(bestline*[data ones(size(data,1),1)]')<sigma; hold on; for i=1:length(mask) if mask(i) plot(data(i,1),data(i,2),'+'); end end
Mytls.m(已知两点求直线)
%这里是解如下三个方程的方程组 %a*x1+b*y1+c=0 %a*x2+b*y2+c=0 %a^2+b^2=1 %返回系数[a b c] function line=Mytls(data) x = data(1, :); y = data(2, :); k=(y(1)-y(2))/(x(1)-x(2)); %直线斜率,有些情况肯定需要个别判断,这里忽略了 a=sqrt(1-1/(1+k^2)); b=sqrt(1-a^2); if k>0 %如果斜率大于0,a,b异号 b=-b; end c=-a*x(1)-b*y(1); line=[a b c]; end
更详尽的介绍见下面的网页:
1.http://en.wikipedia.org/wiki/Ransac
2.http://www.cnblogs.com/xrwang/archive/2011/03/09/ransac-1.html