文献阅读笔记:基于深度学习的桥梁裂缝检测算法研究


论文目的:

传统的图像处理算法不能很好地对桥梁裂缝进行检测 ,
而经典的深度学习模型直接用于桥梁裂缝的检测 , 效果并不理想,针对这些问题 ,
文章提出了一种基于深度学习的桥梁裂缝检测算法

创新点,QA(1-4):

Q1:使用深度学习中的卷积神经网络 (CNN) 进行桥梁裂缝检测 ,
需要大量的、带类别标签的桥梁裂缝图像作为训练集、验证集和测试集 . 但是 ,
到目前为止 ,
全球还没有公开的、带类别标签的、用于深度学习的桥梁裂缝图像数据集。人工采集大量的图像将是个非常严峻的问题。

**A1:**文章中对采集来的 2000 张桥梁裂缝图像研究的基础之上 ,
提出一种基于滑动窗口算法 , 专门用于桥梁裂缝图像数据集的人工扩增方法。

Q2:
桥梁裂缝图像具有背景纹理复杂多样、噪声种类繁多、分布无规律的特点,因此主流的裂缝检测方法效果不够理想。

A2:文章提出了一种基于 CNN 深度学习的 DBCC (Deep bridge crack classify)
分类模型 ,用于识别桥梁裂缝面元和桥梁背景面元。

Q3:如果直接使用传统的窗口滑动算法和 DBCC模型结合检测桥梁裂缝 ,
则有可能检测出过多的桥梁噪声面元

A3:文章提出了改进的滑动窗口算法。

Q4:为了降低算法的时间复杂度 , 加速算法的处理速度 ,
满足桥梁裂缝检测实时处理的要求 , 必须采用多种措施来提高算法的执行效率 .

A4:文章主要采用图像金字塔和 ROI 区域相结合的策略

原理:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YTgiHQAN-1588646168809)(media/28917b672906b1c5b10c0d4baaa7dee3.png)]

人工扩增方法

  1. 将采集来的桥梁裂缝图像归一化为 1024×1024 分辨率的桥梁裂缝图像;

  2. 使用 W × H
    固定大小的窗口在桥梁裂缝图像上不重叠地进行滑动,每滑动一次产生一个小切片作为ROI;

  3. 把不包含桥梁裂缝小切片的图像称为桥梁背景面元
    ,把包含桥梁裂缝的小切片称为桥梁裂缝面元;

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8o301lVv-1588646168812)(media/6b161d64019e8c12a89c78103d538f39.png)]

DBCC模型

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-l8yIDfSb-1588646168814)(media/cc22a288a7db47675df01dfa37f9ae50.png)]

  • IN:16*16*3

  • 偏置项值初始化为 0.1;

  • 4 层卷积层 (C1∼C4);3264128256

  • 3层池化层 (P1∼P3);Max-PoolingAve-PoolingAve-Pooling

  • 2 层全连接层 (FC1∼FC2);

  • SoftMax 函数 (S) 作为损失函数

  • C1、C4 、P2 、P3 、FC1 后面各加一个激活函数(RELU);

  • 第一卷积层后面添加 LRN 层;

  • FC1 后面添加 Dropout 层(D)。

  • OUT: P b (x)、P c (x);

改进过程:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9JjxU0kq-1588646168816)(media/4afcd433137d8f52d34b35a912a2fd62.png)]

改进的窗口滑动算法:

改进之前:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JXQ1FZNc-1588646168818)(media/305aa14c42a6ff94e45162b27e688693.png)]

  • 只根据 P b (x)) ≤ P c (x), 就认为当前的桥梁面元图像为桥梁裂缝面元图像 ,
  • 那么在整幅桥梁裂缝图片识别的时候 ,
  • 有可能将某些桥梁噪音面元误识别为桥梁裂缝面元。

改进之后:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OBqrrP9n-1588646168820)(media/ee5efb90dc3508bb1703f8037df00a64.png)]

算法的加速策略

  1. 首先针对要识别的桥梁裂缝图像构建图像金字塔 , 然后 ,
  2. 在低分辨率的图像上使用检测算法对桥梁裂缝进行检测 ,
  3. 同时对识别出来的桥梁裂缝面元的横纵坐标进行排序
  4. 求出包含裂缝的矩形区域的左上角坐标和右下角坐标 ,
  5. 确定在高分辨率图像上包含裂缝的矩形区域 , 并且将这一矩形区域设为 ROI 区域 .
  6. 最后 , 使用检测算法对 ROI 区域的桥梁裂缝图像进行检测 .

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vgacEUet-1588646168820)(media/cb37f7298e38791775558cac0f5689f9.png)]

实验:

图像采集设备:大疆无人机 Phantom 4 pro 自带的 CMOS 面阵相机

程序:基于主流的深度学习开源框架 Caffe 和计算机视觉开源库 OpenCV,使用 C/C++
、 python 语言开发 ; 程序的运行环境为 Ubuntu14.04, CPU3.3GHz, RAM 8GB

实验结果:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hf8CgkWj-1588646168821)(media/937e5d8f0591ee9db15202475ff7c98a.png)]

总结

对于目前的裂缝检测无公开数据集的问题,文章中的人工扩增方法是个很好的解决方法;

其中的图像金字塔+ROI策略对算法的执行进行了加速,此处应还有更好的优化策略待挖掘。

  • 5
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Shine.Zhang

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值