[图像处理] 实验笔记 - 直线检测(line detection)之霍夫变换

前言

  [图像处理] 实验笔记系列是以图像处理算法为主的文章专栏,以我在算法研究中的实验笔记资料为基础加以整理推出的。该系列内容涉及常见的图像处理算法理论以及常见的算法应用,每篇博客都会介绍相关的算法原理,代码实现和算法在实际应用中的技巧。
  本文主要整理自笔者在一项图像处理任务中的直线检测(line detection)部分的笔记资料,采用了基于霍夫变换(Hough Transform)的直线检测算法。文中给出了直线检测常用的算法介绍,论文资料等,以及笔者的实验笔记和实验结果。
  
  文章小节安排如下:
  1)直线检测相关算法
  2)霍夫直线检测的基本原理
  3)霍夫直线检测的OpenCV实现
  4)直线检测的应用
  
  

一、直线检测相关算法  

1.1 霍夫变换(Hough Transform) 

  霍夫变换(Hough Transform)换于1962年由Paul Hough 首次提出,后于1972年由Richard Duda和Peter Hart推广使用,是图像处理中从图像中检测几何形状的基本方法之一。经典霍夫变换用来检测图像中的直线,后来霍夫变换经过扩展可以进行任意形状物体的识别,例如圆和椭圆。
  
  霍夫变换运用两个坐标空间之间的变换将在一个空间中具有相同形状的曲线或直线映射到另一个坐标空间的一个点上形成峰值,从而把检测任意形状的问题转化为统计峰值问题。
  
  参考论文:
  [1] P.V.C. Hough,Machine Analysis of Bubble Chamber Pictures, Proc. Int. Conf. High Energy Accelerators and Instrumentation, 1959.
  [2] Duda, R. O. and P. E. Hart, “Use of the Hough Transformation to Detect Lines and Curves in Pictures,”Comm. ACM, Vol. 15, pp. 11–15 (January, 1972).
  
  

1.2 霍夫直线检测(Hough Line Detection) 

  Hough直线检测的基本原理在于利用点与线的对偶性,在我们的直线检测任务中,即图像空间中的直线与参数空间中的点是一一对应的,参数空间中的直线与图像空间中的点也是一一对应的。这意味着我们可以得出两个非常有用的结论:
  1)图像空间中的每条直线在参数空间中都对应着单独一个点来表示;
  2)图像空间中的直线上任何一部分线段在参数空间对应的是同一个点。
  
  因此Hough直线检测算法就是把在图像空间中的直线检测问题转换到参数空间中对点的检测问题,通过在参数空间里寻找峰值来完成直线检测任务。
  

1.3 LSD 

  -待续-
  

二、霍夫直线检测的基本原理

2.1 关于对偶性

  首先,我们通过实例来解释一下对偶性的意义。
  1)图像空间中的点与参数空间中的直线一一对应
  在图像空间x-y中一条直线在直角坐标系下可以表示为:
  

直线方程

  其中k和b是参数,对应表示斜率和截距。
  
图像空间的直线

  过某一点A(x 0, y 0)的所有直线的参数均满足方程y 0=k*x 0+b,即点A(x 0, y 0)确定了一族直线。
  如果我们将方程改写为:
  
直接方程形式改写

  那么该方程在参数空间k-b中就对应了一条直线:
  
参数空间的直线

   也就是说,图像空间x-y中的点(x0,y0)对应了参数空间k-b中的直线b=-k*x0+y0。因此可以得到结论,图像空间中的点与参数空间中的直线一一对应。
  
   2)图像空间中的直线与参数空间中的点一一对应
  我们在直线y=k*x+b上再增加一个点B(x 1, y 1),如下图所示:
  
图像空间的直线

  那么点B(x 1, y 1)在参数空间同样对应了一条直线:
  
参数空间的直线
  
  可以看到,图像空间x-y中的点A和点B在参数空间k-b中对应的直线相交于一点,这也就是说AB所确定的直线,在参数空间中对应着唯一一个点,这个点的坐标值(k 0, b 0)也就是直线AB的参数。
  
   以上就是在直线检测任务中关于对偶性的直观解释。这个性质也为我们解决直线检测任务提供了方法,也就是把图像空间中的直线对应到参数空间中的点,最后通过统计特性来解决问题。假如图像空间中有两条直线,那么最终在参数空间中就会对应到两个峰值点,依此类推。
  

2.2 参数空间的选择

  上述为了方便讲解对偶性和霍夫变换的基本原理,我们的参数空间也选择了笛卡尔直角坐标系。但在实际应用中,参数空间是不能选择直角坐标系的,因为原始图像直角坐标空间中的特殊直线x=c(垂直x轴,直线的斜率为无穷大)是没办法在基于直角坐标系的参数空间中表示的。
  
  所以在实际应用中,参数空间采用极坐标系ρ-θ,图示如下:
  

参数空间选择极坐标系时的直线示意

  直线的表达式为:
  
直线表达式

  化简便可得到:
  

化简的直线表达式

  对于直线上的点(x 0, y 0),可以将通过该点的直线族定义为:
  
经过指定点的直线族表达式

  
  
   这就回到我们刚才的结论,参数空间的每个点(ρ,θ)都对应了图像空间的一条直线,或者说图像空间的一个点在参数空间中就对应为一条曲线。参数空间采用极坐标系,这样就可以在参数空间表示原始空间中的所有直线了。
   注意,此时图像空间(直角坐标系x-y)上的一个点对应到参数空间(极坐标系ρ-θ)上是一条曲线,确切的说是一条正弦曲线。
  
参数空间的曲线

  

2.3 利用霍夫变换检测直线

  如前所述,霍夫直线检测就是把图像空间中的直线变换到参数空间中的点,通过统计特性来解决检测问题。具体来说,如果一幅图像中的像素构成一条直线,那么这些像素坐标值(x, y)在参数空间对应的曲线一定相交于一个点,所以我们只需要将图像中的所有像素点(坐标值)变换成参数空间的曲线,并在参数空间检测曲线交点就可以确定直线了。
  
  在理论上,一个点对应无数条直线或者说任意方向的直线,但在实际应用中,我们必须限定直线的数量(即有限数量的方向)才能够进行计算。
  
  因此,我们将直线的方向θ离散化为有限个等间距的离散值,参数ρ也就对应离散化为有限个值,于是参数空间不再是连续的,而是被离散量化为一个个等大小网格单元。将图像空间(直角坐标系)中每个像素点坐标值变换到参数空间(极坐标系)后,所得值会落在某个网格内,使该网格单元的累加计数器加1。当图像空间中所有的像素都经过霍夫变换后,对网格单元进行检查,累加计数值最大的网格,其坐标值(ρ0, θ0)就对应图像空间中所求的直线。
  

参数空间的量化

  
   以上就是霍夫直线检测算法要做的,它检测图像中每个像素点在参数空间对应曲线之间的交点,如果交于一点的曲线的数量超过了阈值,那就可以认为这个交点(ρ,θ)在图像空间中对应一条直线。
    
    

2.4 霍夫直线检测的优缺点

  优点:
  Hough直线检测的优点是抗干扰能力强,对图像中直线的殘缺部分、噪声以及其它共存的非直线结构不敏感。
  缺点:
  Hough变换算法的特点导致其时间复杂度和空间复杂度都很高,并且在检测过程中只能确定直线方向,丢失了线段的长度信息。
  
  

三、霍夫直线检测的OpenCV实现  

  OpenCV支持三种霍夫直线检测算法:
  1)Standard Hough Transform(SHT,标准霍夫变换)
  2)Multiscale Hough Transform(MSHT,多尺度霍夫变换)
  3)Progressive Probability Houth Transform(PPHT,渐进概率式霍夫变换)
  

3.1 霍夫直线检测函数定义

  在OpenCV2.1之前的版本,霍夫直线检测函数如下:
  
  函数原型:

CVAPI(CvSeq*) cvHoughLines2( CvArr* image, void* line_storage, int method,
  double rho, double theta, int threshold,
  double param1 CV_DEFAULT(0), double param2 CV_DEFAULT(0),
  double min_theta CV_DEFAULT(0), double max_theta CV_DEFAULT(CV_PI));

  函数说明:
  cvHoughLines2老版OpenCV的霍夫直线检测函数,通过method参数可以支持三种霍夫直线检测算法,分别是CV_HOUGH_STANDARD、CV_HOUGH_PROBABILISTIC =1、CV_HOUGH_MULTI_SCALE。
  
  
  在OpenCV新版本下,霍夫直线检测算法定义了两个函数:HoughLines、HoughLinesP
  1)HoughLines:标准霍夫变换、多尺度霍夫变换
  函数原型:

CV_EXPORTS_W void HoughLines( InputArray image, OutputArray lines,
  double rho, double theta, int threshold,
  double srn = 0, double stn = 0,
  double min_theta = 0, double max_theta = CV_PI );
  

  参数说明:
  InputArray image:输入图像,必须是8位单通道图像。
  OutputArray lines:检测到的线条参数集合。
  double rho:以像素为单位的距离步长。
  double theta:以弧度为单位的角度步长。
  int threshold:累加计数值的阈值参数,当参数空间某个交点的累加计数的值超过该阈值,则认为该交点对应了图像空间的一条直线。
  double srn:默认值为0,用于在多尺度霍夫变换中作为参数rho的除数,rho=rho/srn。
  double stn:默认值为0,用于在多尺度霍夫变换中作为参数theta的除数,theta=theta/stn。
  
  函数说明:
  HoughLines函数输出检测到直线的矢量表示集合,每一条直线由具有两个元素的矢量(ρ, θ)表示,其中ρ表示直线距离原点(0, 0)的长度,θ表示直线的角度(以弧度为单位)。
HoughLines函数无法输出图像空间中线段的长度,这也是霍夫变换本身的弱点。

  
  备注说明:
  如果srn和stn同时为0,就表示HoughLines函数执行标准霍夫变换,否则就是执行多尺度霍夫变换。
  
  
  2)HoughLinesP:渐进概率式霍夫变换
  函数原型:

CV_EXPORTS_W void HoughLinesP( InputArray image, OutputArray lines,
  double rho, double theta, int threshold,
  double minLineLength = 0, double maxLineGap = 0 );
  

  参数说明:
  InputArray image:输入图像,必须是8位单通道图像。
  OutputArray lines:检测到的线条参数集合。
  double rho:直线搜索时的距离步长,以像素为单位。
  double theta:直线搜索时的角度步长,以弧度为单位。
  int threshold:累加计数值的阈值参数,当参数空间某个交点的累加计数的值超过该阈值,则认为该交点对应了图像空间的一条直线。
  double minLineLength:默认值为0,表示最小线段长度阈值(像素)。
  double maxLineGap:默认值为0,表示直线断裂的最大间隔距离阈值。即如果有两条线段是在一条直线上,但它们之间有间隙,那么如果这个间隔距离大于该值,则被认为是一条线段,否则认为是两条线段。
  
  函数说明:
  HoughLinesP函数输出检测到直线的矢量表示集合,每一条直线由具有四个元素的矢量(x1, y1, x2, y2)表示,其中(x1, y1)表示线段的起点,(x2, y2)表示线段的终点。
  HoughLinesP函数可以检测出图像空间中线段的长度。

  
  

3.2 霍夫直线检测函数使用

  霍夫直线变换是一种用来在图像空间寻找直线的方法,输入图像要求是二值图像,同时为了提高检测直线的效率和准确率,在使用霍夫线变换之前,最好对图像进行边缘检测生成边缘二值图像,这样的检测效果是最好的。
  
  1)HoughLines函数
  代码:

std::string img_path;
cv::Mat mat_color;
cv::Mat mat_gray;
cv::Mat mat_binary;
cv::Mat mat_canny;
cv::Mat mat_board;

img_path = "line.png";
mat_color = cv::imread(img_path, 1);
mat_gray = cv::imread(img_path, 0);
mat_board = cv::Mat(mat_color.size(), mat_color.type(), Scalar::all(255));

// binary
cv::threshold(mat_gray, mat_binary, 0.0, 255.0, cv::THRESH_OTSU);
// invert color
cv::bitwise_not(mat_binary, mat_binary);

// detect edge
Canny(mat_binary, mat_canny, 50, 200, 3);

// detect line
vector<Vec2f> lines;
HoughLines(mat_canny, lines, 1, CV_PI / 180, 150, 0, 0);

// draw line
cout << "line number: " << lines.size() << endl;
for (size_t i = 0; i < lines.size(); i++)
{
    Vec2f linex = lines[i];
    cout << "radius: " << linex[0] << ", radian: "<< linex[1] << ", angle: " << 180 / CV_PI * linex[1] << endl;
    float rho = lines[i][0], theta = lines[i][1];
    Point pt1, pt2;
    double a = cos(theta), b = sin(theta);
    double x0 = a * rho, y0 = b * rho;
    pt1.x = cvRound(x0 + 1000 * (-b));
    pt1.y = cvRound(y0 + 1000 * (a));
    pt2.x = cvRound(x0 - 1000 * (-b));
    pt2.y = cvRound(y0 - 1000 * (a));
    line(mat_board, pt1, pt2, Scalar(255, 0, 0), 1);
}
cv::imshow("gray", mat_gray);
cv::imshow("binary", mat_binary);
cv::imshow("canny", mat_canny);
cv::imshow("color", mat_board);
cv::waitKey();

  原图:
  

原图

  二值图:
  
二值图

  边缘图:
  
边缘图

  检测效果:
  
HoughLines的检测效果

  
  2)HoughLinesP函数
  代码:

std::string img_path;
cv::Mat mat_color;
cv::Mat mat_gray;
cv::Mat mat_binary;
cv::Mat mat_canny;
cv::Mat mat_board;

img_path = "line.png";
mat_color = cv::imread(img_path, 1);
mat_gray  = cv::imread(img_path, 0);
mat_board = cv::Mat(mat_color.size(), mat_color.type(), Scalar::all(255));

// binary
cv::threshold(mat_gray, mat_binary, 0.0, 255.0, cv::THRESH_OTSU);
// invert color
cv::bitwise_not(mat_binary, mat_binary);

// detect edge
Canny(mat_binary, mat_canny, 50, 200, 3);

// detect line
vector<Vec4i> lines;
HoughLinesP(mat_canny, lines, 1, CV_PI / 180, 150, 50, 50);

// draw line
cout << "line number: " << lines.size() << endl;
for (size_t i = 0; i < lines.size(); i++)
{
    Vec4i linex = lines[i];
    line(mat_board, Point(linex[0], linex[1]), Point(linex[2], linex[3]), Scalar(255, 0, 0), 1);
}

cv::imshow("gray",   mat_gray);
cv::imshow("binary", mat_binary);
cv::imshow("canny", mat_canny);
cv::imshow("color", mat_board);
cv::waitKey();

  检测效果:
  

HoughLinesP的检测效果

  
  

四、直线检测的应用

4.1 直线检测的实际应用

  直线检测是机器视觉和模式识别中最重要的任务之一,对图像理解/分析等有重要的意义。在实际应用中,直线检测可用于机器人定位中的网格识别,板材的裂纹检测,表单票据的格式识别,零件纹路的检测,自动驾驶中的车道检测等等,可以看出,在工业领域中,直线检测以及各种图像处理技术应用是非常丰富的。
  

4.2 直线检测在图像矫正方面的应用

  笔者最近在一个OCR项目也使用了Hough Line Detection算法。在该项目中,待识别文本图像的内容是倾斜的(即文字是倾斜的),我们采用的测略就是通过直线检测确定图像内容的倾斜程度并进行旋转纠正,这样得到的无倾斜图像更有利于OCR任务。
  原图:
  

原图

  矫正效果:
  
矫正效果

  

五、参考资料

参考论文与书目:
[1] Duda, R. O. and P. E. Hart, “Use of the Hough Transformation to Detect Lines and Curves in Pictures,”Comm. ACM, Vol. 15, pp. 11–15 (January, 1972).
[2] 顾思妍. 机器视觉的直线检测技术及应用研究[D].广东工业大学,2011.
[3] 数字图像处理[M]. 电子工业出版社 , (美)RafaelC.Gonzalez,(美)RichardE.Woods,(美)StevenL.Eddins著, 2005

参考博客:
Hough变换-理解篇
http://blog.csdn.net/abcjennifer/article/details/7448513
Hough transform(霍夫变换)
http://www.cnblogs.com/AndyJee/p/3805594.html
霍夫变换概述和标准霍夫变换
http://www.jianshu.com/p/55eabb42c6c2

  • 16
    点赞
  • 75
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
霍夫变换(Hough Transform)是一种图像处理算法,用于检测在二维平面上的物体形状,特别是直线或圆形。 在图像处理中,霍夫变换主要用于直线检测直线可以表示为 y = mx + b 的形式,其中 m 是斜率,b 是截距。霍夫变换的目标是从图像中找到直线的参数 m 和 b。 霍夫变换的基本思想是将图像中的每个点转换为一个参数空间(霍夫空间)中的曲线,这个曲线表示所有可能的直线通过这个点的位置。在霍夫空间中,每个曲线都表示一条直线。因此,找到在霍夫空间中交叉的曲线对应的参数,就可以确定图像中的直线。 以下是 Java 实现的霍夫变换代码示例: ``` import java.awt.image.BufferedImage; import java.io.File; import javax.imageio.ImageIO; public class HoughTransform { public static void main(String[] args) throws Exception { BufferedImage image = ImageIO.read(new File("input.png")); int width = image.getWidth(); int height = image.getHeight(); // 设置霍夫空间的参数范围 int minTheta = -90; int maxTheta = 90; int thetaRange = maxTheta - minTheta; int maxRho = (int) Math.sqrt(width * width + height * height); int rhoRange = 2 * maxRho; // 创建霍夫空间 int[][] houghSpace = new int[rhoRange][thetaRange]; // 遍历图像中的每个点 for (int x = 0; x < width; x++) { for (int y = 0; y < height; y++) { int pixel = image.getRGB(x, y); if (pixel != 0) { // 像素不是黑色 // 在霍夫空间中增加点对应的曲线 for (int thetaIndex = 0; thetaIndex < thetaRange; thetaIndex++) { double theta = Math.toRadians(minTheta + thetaIndex); int rho = (int) (x * Math.cos(theta) + y * Math.sin(theta)); rho += maxRho; houghSpace[rho][thetaIndex]++; } } } } // 查找霍夫空间中的峰值 int maxCount = 0; int maxRhoIndex = 0; int maxThetaIndex = 0; for (int rhoIndex = 0; rhoIndex < rhoRange; rhoIndex++) { for (int thetaIndex = 0; thetaIndex < thetaRange; thetaIndex++) { if (houghSpace[rhoIndex][thetaIndex] > maxCount) { maxCount = houghSpace[rhoIndex][thetaIndex]; maxRhoIndex = rhoIndex; maxThetaIndex = thetaIndex; } } } // 计算最大峰值对应的直线参数 double maxTheta = Math.toRadians(minTheta + maxThetaIndex); int maxRho = maxRhoIndex - maxRho; int x1 = 0; int y1 = (int) (maxRho / Math.sin(maxTheta)); int x2 = (int) (maxRho / Math.cos(maxTheta)); int y2 = 0; // 在图像中绘制直线 for (int x = 0; x < width; x++) { int y = (int) ((maxRho - x * Math.cos(maxTheta)) / Math.sin(maxTheta)); if (y >= 0 && y < height) { image.setRGB(x, y, 0xFF0000); } } for (int y = 0; y < height; y++) { int x = (int) ((maxRho - y * Math.sin(maxTheta)) / Math.cos(maxTheta)); if (x >= 0 && x < width) { image.setRGB(x, y, 0xFF0000); } } // 保存输出图像 ImageIO.write(image, "png", new File("output.png")); } } ``` 这段代码读取一个输入图像,执行霍夫变换,并在输出图像中绘制检测到的直线。注意,这只是一个简单的示例,实际使用时可能需要进行更多的参数调整和优化。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值