本文主要涉及两个方面:1、Hough变换用于直线检测 2、实现同一窗口显示多幅图片
*********************************************************先看文末示例程序截图******************************************
**********************************************************************************************************
一、霍夫变换的基本原理
1.1图像空间到参数空间的转换
对于图像中共线的点集{(x0,y0), (x1,y1), ...}都经过直线y=kx+b,先在我们换一个说法,“斜率为k,截距为b的直线y=kx+b包含了所有在该直线上的点”。一种强调的是图像中的点集,另一种强调的是直线的参数k和b,通过直线的点集去描述这条直线明显没有直接通过k,b两个参数去描述那样直接方便。而Hough变换就是将我们“点共线”的思维转化到参数空间{k,b}进行描述,图像空间中所有经过y=kx+b的点经过Hough变换后在参数空间都会相交于点(k,b),这样,通过Hough变换,就可以将图像空间中直线的检测转化为参数空间中对点的检测。我们不妨将y=kx+b进行一下变形:
这就是Hough变换将图像空间坐标(x,y)转化为参数空间(k,b)的Hough变换式。
Hough变换的步骤(执行过程):
-
在参数空间中建立一个二维(分别对应k,b)计数器,实际就是二维数组kbcnt,k维度为图像中直线斜率可能范围,b维度为图像中截距可能范围;数组中所有值都初始化为0;
-
扫描图像空间中的所有点(xi,yi),Hough变换式进行图像空间到参数空间的变换(ki,bi),计数kbcnt(ki,bi)++
-
设定阈值thr(图像中有多少个点共线才认为存在直线),kbcnt(ki,bi)>thr的ki,bi组成图像中的直线y=ki*x+bi
然而,上面的检测直线的方案貌似还有些问题:如果图像中存在竖直的直线呢,那kbcnt的k维度岂不是要无穷大!因此,才有了另一种参数空间的方案:利用极坐标参数而非“斜率-截距式”描述直线。
极坐标中的直线方程为
将其改写成Hough变换式,即自变量(x,y)到参数变量(r,theta)的映射:
使用极坐标参数空间,Hough变换的步骤不变,只不过将kbcnt替换成rthcnt,r范围是图像对角线的长度,th范围是0~2*pi。因为图像是离散的,所以r和th都有一个步进值dr和dth。
Hough变换除了检测直线,还可用来检测任何能用数学表达式表示的形状,如最常见的圆、椭圆,基本原理都是将图像空间的像素转变到参数空间,然后在参数空间中对共线/圆/椭圆的点进行统计,最后通过阈值判决是否是符合要求的形状。
******有关霍夫变换更为详细原理介绍参见:Hough Transform ************
二、霍夫直线变换函数介绍
1.编程思路
a. 读取一幅带处理二值图像,最好背景为黑色;b. 取得源像素数据;
c. 根据直线的霍夫变换公式完成霍夫变换,预览霍夫空间结果;
d. 寻找最大霍夫值,设置阈值,反变换到图像RGB值空间(程序难点之一);
e. 越界处理,显示霍夫变换处理以后的图像;
2.霍夫线变换函数
函数作用:霍夫线变换函数可以在二值图像中找到直线。函数原型:
void cv::HoughLines | ( | InputArray | image, |
OutputArray | lines, | ||
double | rho, | ||
double | theta, | ||
int | threshold, | ||
double | srn = 0 , | ||
double | stn = 0 , | ||
double | min_theta = 0 , | ||
double | max_theta = CV_PI | ||
) |
InputArray image:输入矩阵,输入 8位、单通道 (二值) 图像
OutputArray lines:输出矩阵,用于参数霍夫变换检测到的直线输出矢量。
double rho:与象素相关单位的距离精度
double theta:弧度测量的角度精度
int threshold:累加平面的阈值参数,即识别某部分为图中的一条直线时它在累加平面中必须达到的值。大于阈值threshold的线段才可以被检测通过并返回到结果中。
double srn:有默认值0。对于多尺度的霍夫变换,这是第三个参数进步尺寸rho的除数距离。粗略的累加器进步尺寸直接是第三个参数rho,而精确的累加器进步尺寸为rho/srn。
double stn:有默认值0,对于多尺度霍夫变换,srn表示第四个参数进步尺寸的单位角度theta的除数距离。且如果srn和stn同时为0,就表示使用经典的霍夫变换。否则,这两个参数应该都为正数。查取OpenCV参考文献来获取更多信息
三、同一窗口显示多幅图片
若要在OpenCV实现同一窗口显示多幅图片,图片要按矩阵方式排列,类似于Matlab中subplot();
该功能的由自定义函数实现,实现的详见代码:
//注意:imshowMany()函数ROI法,要求各图片的颜色通道数目一直,次数为三通道
//要显示单通道灰度图或二值图图片需要转换颜色空间cvtcolor()
//模糊处理内核的选择和霍夫变换时精度选择对最终结果影响较大
#include<opencv2/opencv.hpp>
#include<opencv2/imgproc/imgproc.hpp>
using namespace cv;
using namespace std;
#define NameWindow "【0】图片处理效果集锦"
void imshowMany(const std::string& _winName, const vector<Mat>& ployImages);//
int main()
{
Mat srcImage = imread("building.jpg");
imshow("【1】原图", srcImage);
Mat temImage, grayImage,midImage,edgeImage, dstImage;
cvtColor(srcImage, grayImage, CV_BGR2GRAY);//转换为灰度图
blur(grayImage, grayImage, Size(5, 5), Point(-1, -1));//均值模糊
//GaussianBlur(grayImage, grayImage, Size(5, 5), 0, 0);
imshow("【2】原图灰度图+均值模糊", grayImage);
cvtColor(grayImage, midImage, CV_GRAY2BGR);//转为三通道图,用于多图显示,位置(1,2)
Canny(grayImage, edgeImage, 50, 100, 3);//tempImage为单通道二值图,在多图函数中不可显示
imshow("【3】灰度图Canny边缘检测", edgeImage);
cvtColor(edgeImage, temImage, CV_GRAY2BGR);//转为三通道图,用于多图显示,位置(2,1)
cvtColor(edgeImage, dstImage, CV_GRAY2BGR);//转为三通道图,用于多图显示,位置(2,2)
vector<Vec2f>lines;//矢量结构lines用于存放得到的线段矢量集合
HoughLines(edgeImage, lines, 1, CV_PI / 180, 123, 0, 0);//阈值的选择对结果影响很大
for (size_t i = 0; i < lines.size(); i++)//在图中绘制出每条线段
{
float rho = lines[i][0], theta = lines[i][1];
Point pt1, pt2;
double a = cos(theta), b = sin(theta);
double x0 = a*rho, y0 = b*rho;
pt1.x = cvRound(x0 + 1000 * (-b));
pt1.y = cvRound(y0 + 1000 * (a));
pt2.x = cvRound(x0 - 1000 * (-b));
pt2.y = cvRound(y0 -1000 * (a));
line(dstImage, pt1, pt2, Scalar(255, 0,255), 1, 8);//线条颜色为紫色
}
imshow("【4】基于canny的Hough直线变换",dstImage);
vector<Mat>Images(4);//模板类vector,用于放置4个类型为Mat的元素,即四张图片
Images[0] = srcImage;
Images[1] = midImage;
Images[2] = temImage;
Images[3] = dstImage;
namedWindow(NameWindow);
imshowMany(NameWindow, Images);//调用一个窗口显示多图函数
waitKey(0);
return 0;
}
//自定义一个窗口显示多图函数
void imshowMany(const std::string& _winName, const vector<Mat>& ployImages)
{
int nImg = (int)ployImages.size();//获取在同一画布中显示多图的数目
Mat dispImg;
int size;
int x, y;
//若要在OpenCV实现同一窗口显示多幅图片,图片要按矩阵方式排列,类似于Matlab中subplot();
//w:多图按矩阵排列的行数 ,h: 多图按矩阵排列的的数
int w, h;
float scale;//缩放比例
int max;
if (nImg <= 0)
{
printf("Number of arguments too small....\n");
return;
}
else if (nImg > 12)
{
printf("Number of arguments too large....\n");
return;
}
else if (nImg == 1)
{
w = h = 1;
size = 400;
}
else if (nImg == 2)
{
w = 2; h = 1;//2x1
size = 400;
}
else if (nImg == 3 || nImg == 4)
{
w = 2; h = 2;//2x2
size = 400;
}
else if (nImg == 5 || nImg == 6)
{
w = 3; h = 2;//3x2
size = 300;
}
else if (nImg == 7 || nImg == 8)
{
w = 4; h = 2;//4x2
size = 300;
}
else
{
w = 4; h = 3;//4x3
size =200;
}
dispImg.create(Size(100 + size*w, 30 + size*h), CV_8UC3);//根据图片矩阵w*h,创建画布,可线的图片数量为w*h
for (int i = 0, m = 20, n = 20; i<nImg; i++, m += (20 + size))
{
x = ployImages[i].cols; //第(i+1)张子图像的宽度(列数)
y = ployImages[i].rows;//第(i+1)张子图像的高度(行数)
max = (x > y) ? x : y;//比较每张图片的行数和列数,取大值
scale = (float)((float)max / size);//计算缩放比例
if (i%w == 0 && m != 20)
{
m = 20;
n += 20 + size;
}
Mat imgROI = dispImg(Rect(m, n, (int)(x / scale), (int)(y / scale))); //在画布dispImage中划分ROI区域
resize(ployImages[i], imgROI, Size((int)(x / scale), (int)(y / scale))); //将要显示的图像设置为ROI区域大小
}
namedWindow(_winName);
imshow(_winName, dispImg);
}
四、运行结果
一个窗口多图显示:
分开显示: