多边形逼近cv2.approxPolyDP和Douglas-Peucker算法

在查看文本检测模型DBNet测试结果时发现有文本行没检测出来,因为DBNet是用语义分割模型检测出文本行的kernel,后处理对kernel进行膨胀得到完整的文本区域,查看模型输出图发现该行的kernel检测出来了,是后处理时去掉了这行文本。

具体代码如下所示,其中contour是通过cv2.findContours找到的上图框出白色区域的轮廓,cv2.arcLength返回轮廓的周长,cv2.approxPolyDP是多边形逼近,因为是文本行,返回的框至少应该是个四边形,这行文本返回多边形的顶点小于4所以被忽略了。

epsilon = 0.005 * cv2.arcLength(contour, True)
approx = cv2.approxPolyDP(contour, epsilon, True)
points = approx.reshape((-1, 2))
if points.shape[0] < 4:
    continue

cv2.approxPolyDP使用的是Douglas-Peucker算法,原理如下:

在数字化时,要对曲线进行采样,即在曲线上取有限个点,将其变为折线,并且能够在一定程度上保持原有的形状。经典的Douglas-Peucker算法步骤如下:

  1. 在曲线首尾两点A,B之间连接一条直线AB,该直线为曲线的弦;
  2. 得到曲线上离该直线段距离最大的点C,计算其与AB的距离d;
  3. 比较该距离与预先给定的阈值threshold的大小,如果小于threshold,则该直线段作为曲线的近似,该段曲线处理完毕;
  4. 如果距离大于阈值,则用C将曲线分为两段AC和BC,并分别对两段取信进行1~3的处理。
  5. 当所有曲线都处理完毕时,依次连接各个分割点形成的折线,即可以作为曲线的近似。

由此可见,设定的阈值越小,拟合的越精准,拟合后多边形的边和顶点越多。cv2.approxPolyDP的参数2(epsilon)是一个距离值,表示多边形的轮廓接近实际轮廓的程度,值越小,越精确。虽然不确定epsilon是不是就是threshold,但肯定和threshold是正相关的。参数3表示是否闭合。

代码中epsilon设的太大,导致返回了两个顶点,也就是轮廓左上到右下的一条直线,这个区域轮廓上所有点到这条直线的距离都满足小于阈值。通过调小epsilon,代码中将系数0.005改为0.001后正常了,返回了一个四边形的四个顶点。

参考

Douglas-Peucker算法 - qingsun_ny - 博客园

  • 5
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
Douglas-Peucker算法是一种用于曲线抽稀的算法,其难点主要涉及以下几个方面: 1. 抽稀误差的选择:Douglas-Peucker算法通过计算每个点到折线的垂直距离来确定是否保留该点。这个过程中需要选择合适的抽稀误差阈值,即判断点是否保留的阈值。选择过小的阈值会导致折线过于密集,保留过多的点;而选择过大的阈值会导致折线过于稀疏,可能会丢失重要的细节。 2. 折线拟合的准确性:Douglas-Peucker算法通过不断递归地进行抽稀操作,直到满足抽稀误差阈值。在每次递归中,需要拟合一条直线来代表原始曲线上的点。这个过程中,选择合适的直线拟合方法和准确的拟合结果是一个难点。 3. 算法复杂度和效率:Douglas-Peucker算法在每次递归中需要计算每个点到折线的垂直距离,这个计算量与点的数量成正比。当处理大规模数据时,算法的复杂度和效率成为一个挑战,需要考虑如何优化算法以提高处理速度。 4. 曲线的形状和特征:Douglas-Peucker算法对于不同形状和特征的曲线可能表现出不同的效果。例如,对于弯曲的曲线或存在局部细节的曲线,算法可能会有一定的局限性,需要考虑如何调整参数或采用其他方法来处理这些情况。 综上所述,Douglas-Peucker算法在曲线抽稀中存在一些难点,需要仔细选择抽稀误差、拟合准确性、算法效率以及适应不同曲线特征等方面的问题。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

00000cj

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值