自己整理线段检测方法

传统方法

LSD

2020
这个不用说了,目前应用最广的

EDlines

速度是LSD的十倍,但是精度差不多,优势就是快。

MCMLSD

基于深度学习的方法

TP-LSD L-CNN SOLD2 hawp DeepLSD LETR

TP-LSD

2020

L-CNN

2019
似乎是一个端到端的线框解析,End-to-End Wireframe Parsing

官方Github:https://github.com/zhou13/lcnn

paper: Yichao Zhou, Haozhi Qi, Yi Ma. "End-to-End Wireframe Parsing." ICCV 2019.

hawp

2020
这个不光检测出线段,还给出线段连接点,我感觉很好,对建图以及后端优化非常有意义,这个似乎是和L-CNN同一个框架的,都属于线框解析,线框解析(Wireframe parsing)的目标如下图,是要在图像中检测出显著的直线(salient line segments)和连接点(junction),在这篇论文之前,效果最好的线框解析方法是L-CNN,L-CNN对于这个问题的处理方法是通过深度学习学习到一个连接点检测器(junction detector),而没有直接学习一个线段检测器.对于线段,L-CNN使用了一种采样方法基于预测的junctions来生成线段的proposals,之后通过一个验证模块对proposals进行分类。

参考自:https://blog.csdn.net/i0o0iW/article/details/111415463

DeepLSD

2022年 Rémi Pautrat等人提出DeepLSD(Line Segment Detection and Refinement with Deep Image Gradients),DeepLSD使用深度网络处理图像,生成线吸引力场,然后将其转换为替代图像梯度幅度和角度,再用现有的手工线检测器进行线段检测,因此,DeepLSD不仅对光照和噪声具有更强的鲁棒性,同时还保留了经典方法的准确性。(参考自https://m.elecfans.com/article/1975080.html)

SOLD2

2021年,来自苏黎世联邦理工学院和微软的研究者提出了提出了首个联合检测与描述线段的深度网络SOLD2,由于采用了自监督学习,SOLD2不需要对线进行标注,因而可以推广到任一数据集。与线框分析(wireframe parsing)不同的是,SOLD2可对图像中的线段进行可重复且准确的定位。同时,SOLD2所提出的线描述符具有很高的可分辨性,也对视角变化和遮挡有着很强的鲁棒性。

M-LSD

2022
之前的基于深度学习的线段检测(LSD) 模型大且计算耗时。这限制了他们的实时性和使用环境。 在这个 论文中,我们提出了在资源受限的环境下的一种实时的、轻量级的线段检测器Mobile LSD (M-LSD)。 我们设计了一种非常高效的结构,通过最小化骨干网络和去除典型的多模块流程进行直线预测。为了在一个轻量级的网络中保持竞争性能,我们提出了新的训练方案:线段分割增强(SoL)、匹配和几何关系损失函数。 SoL增强将一条线细分成多个子部件,用于在训练过程中提供辅助线端数据。 此外,匹配和几何损失允许模型捕捉额外的几何线索。 与以前最好的实时LSD方法TP-LSD-Lite相比,我们的模型(M-LSDtiny)以2.5%的模型达到了具有竞争力的性能,GPU上的推断速度提高了130.5%。此外,我们的模型可以以56.8 FPS和48.6 FPS运行在最新的Android和iPhone移动设备。 据我们所知,这是第一次实时深度 移动设备上可用的LSD。 且代码是开源的,开源地址:https://github.com/navervision/mlsd

LETR

2021
基于 Transformer 的端到端线段检测,见:https://zhuanlan.zhihu.com/p/432300990
Line Segment Detection Using Transformers without Edges. Yifan Xu*, Weijian Xu*, David Cheung, and Zhuowen Tu. CVPR2021 (Oral)

传统的形态学线段检测首先要对图像进行边缘检测,然后进行后处理得到线段的检测结果。一般的深度学习方法,首先要得到线段端点和线的热力图特征,然后进行融合处理得到线的检测结果。作者提出了一种新的基于 Transformer 的方法,无需进行边缘检测、也无需端点和线的热力图特征,端到端的直接得到线段的检测结果,也即线段的端点坐标。
链接:https://juejin.cn/post/6994634824354889758

代码可见:https://github.com/mlpc-ucsd/LETR
M-LSD的论文里面已经和LETR做对比了

输入图片说明

这里可以看到一些方法的年份
 

输入图片说明

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值