直线检测霍夫变换VS深度学习

1. 引言

直线检测有很多应用:例如,创建矢量化图、端点检测等。在这篇文章中,我们不讨论其具体的应用程序,而是重点关于于如何使用传统算法和深度学习的方法来进行直线检测,这里我们将对二者进行相关比较。
闲话少说,我们直接开始吧!

2. 霍夫变换

通过opencv-python进行canny边缘检测和hough变换来进行直线检测是图像处理中最基本的思想。
其中,一个简单的读取图像并获取直线的样例代码如下:

import cv2 
path = 'sudoku-png-6.png'
src = cv.imread(cv.samples.findFile(path), cv.IMREAD_GRAYSCALE)
dst = cv.Canny(src, 50, 200, None, 3)
linesP = cv.HoughLinesP(dst, 1, np.pi / 180, 50, None, 50, 10)

cdstP = np.zeros(src.shape,dtype=np.uint8)
cdstP.fill(255) # or img[:] = 255
cdstP = cv.cvtColor(cdstP, cv.COLOR_GRAY2BGR)

if linesP is not None:
  for i in range(0, len(linesP)):
    l = linesP[i][0]
    cv.line(cdstP, (l[0], l[1]), (l[2], l[3]), (0,0,255), 3, cv.LINE_AA)

cv.imwrite('lines.png', cdstP)

得到结果如下:
在这里插入图片描述

3. 神经网络

当然,直线检测在神经网络领域也有各种各样的实现方式,本文重点推荐两种最为常用的。
● 方案一:Deep Hough Transform for Semantic Line Detection

自然图像中的“语义线”指的是图像中能够勾勒出图像内容结构的直线,例如不同区域的分割线,建筑物的中轴线等等。语义线检测在摄影构图,图像处理等下游任务中有着广泛应用。如下图所示,将图像中的语义线置于照片的黄金分割比位置能拍出视觉效果更好的图片 。

而本文就是利用 神经网络在神经网络特征图上进行相应的霍夫变换,从而兼顾了CNN的特征学习能力和霍夫变换的高效性。

论文地址:点我
GitHub: 点我
在线demo: 点我

在线demo的一些测试效果如下:

在这里插入图片描述

● 方案二: LETR: Line Segment Detection Using Transformers without Edges

在这里插入图片描述

同样我们也有其他方法,如LETR(线段检测),使用wireframe数据集来找到更多可以描述3D对象的分割线

论文地址:点我
GitHub: 点我
在线demo: 点我
在线demo的一些测试效果如下:
在这里插入图片描述

● 二者对比

第一种方法找到图像中所有的语义分界线,因此它可以用来找到更好的透视线;第二种方法是找到元素边界的分割线,这些分割线可以用来在很短的时间内创建一个3D模型,进而得到图像的纹理。

4. 总结

如果我们需要解决简单的任务,比如检测桌子、数独或网球场的线条,在特定的光线条件下,场景不会有太大的变化,那么传统的图像处理的方法就是最好的解决方案,特点为:简单、可控,不需要太多的计算资源。
但是,对于场景更为多变的任务,神经模型的表现可以更好,泛化能力更强。
最后,我上面展示的所有内容都是开源的,所以请使用它并为开源做出更多贡献!!!

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
import cv2 as cv import numpy as np #直线检测 #使用霍夫直线变换做直线检测,前提条件:边缘检测已经完成 #标准霍夫线变换 def line_detection(image): gray = cv.cvtColor(image, cv.COLOR_RGB2GRAY) edges = cv.Canny(gray, 50, 150) #apertureSize参数默认其实就是3 cv.imshow("edges", edges) #cv.HoughLines参数设置:参数1,灰度图像;参数二,以像素为单位的距离精度(一般都是1,进度高,但是速度会慢一点) #参数三,以弧度为单位的角度精度(一般是1rad);参数四,阈值,大于阈值threshold的线段才可以被检测通过并返回到结果中 #该函数返回值为rho与theta lines = cv.HoughLines(edges, 1, np.pi/180, 200) for line in lines: rho, theta = line[0] #line[0]存储的是点到直线的极径和极角,其中极角是弧度表示的。 a = np.cos(theta) #theta是弧度 b = np.sin(theta) x0 = a * rho #代表x = r * cos(theta) y0 = b * rho #代表y = r * sin(theta) x1 = int(x0 + 1000 * (-b)) #计算直线起点横坐标 y1 = int(y0 + 1000 * a) #计算起始起点纵坐标 x2 = int(x0 - 1000 * (-b)) #计算直线终点横坐标 y2 = int(y0 - 1000 * a) #计算直线终点纵坐标 注:这里的数值1000给出了画出的线段长度范围大小,数值越小,画出的线段越短,数值越大,画出的线段越长 cv.line(image, (x1, y1), (x2, y2), (0, 0, 255), 2) #点的坐标必须是元组,不能是列表。 cv.imshow("image-lines", image) #统计概率霍夫线变换 def line_detect_possible_demo(image): gray = cv.cvtColor(image, cv.COLOR_RGB2GRAY) edges = cv.Canny(gray, 50, 150, apertureSize=3) # apertureSize参数默认其实就是3 lines = cv.HoughLinesP(edges, 1, np.pi / 180, 60, minLineLength=60, maxLineGap=5) for line in lines: x1, y1, x2, y2 = line[0] cv.line(image, (x1, y1), (x2, y2), (0, 0, 255), 2) cv.imshow("line_detect_possible_demo",image) src = cv.imread("E:/opencv/picture/track.jpg") print(src.shape) cv.namedWindow('input_image', cv.WINDOW_AUTOSIZE) cv.imshow('input_image', src) line_detection(src) src = cv.imread("E:/opencv/picture/track.jpg") #调用上一个函数后,会把传入的src数组改变,所以调用下一个函数时,要重新读取图片 line_detect_possible_demo(src) cv.waitKey(0) cv.destroyAllWindows() 霍夫检测直线原理: 关于hough变换,核心以及难点就是关于就是有原始空间到参数空间的变换上。以直线检测为例,假设有一条直线L,原点到该直线的垂直距离为p,垂线与x轴夹角为θθ,那么这条直线是唯一的,且直线的方程为 ρ=xcosθ+ysinθρ=xcosθ+ysinθ, 如下图所

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

赵卓不凡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值