基于深度学习利用目标检测的方法定位瑕疵位置

最新推荐文章于 2024-04-11 09:43:11 发布

狗庄欺人太甚

最新推荐文章于 2024-04-11 09:43:11 发布

阅读量931

点赞数 4

分类专栏： python 文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_48262500/article/details/120230130

版权

70 篇文章 1 订阅

订阅专栏

利用目标检测的方法定位瑕疵位置

通过语义分割的方法分割瑕疵（使用传统方法，如二值化等方法分割亦可）

图像分类的方法判断类别

问题：

检测手机屏幕表面的瑕疵，在图中画出瑕疵位置并标明瑕疵种类。

Screen task

该数据集包含100张手机屏幕图片。

手机屏幕缺陷分成四类：气泡、针孔、锡灰、划痕

大致思路如下：

1.数据预处理，将不同种类的图片分割成指定大小，建立模型训练数据集。

（转为VOC或者COCO格式）安装了roLabelImg标注工具。

dataset下面的xml数据转化为pkl文件

2.训练自己的分类器（YOLD,SSD模型）

输入图片通过模型来得到指定区域的特征向量，如果该向量和底库中A类型缺陷的某个向量相乘，如果大于指定的阈值，模型就认为这个区域就是A类型

通用目标检测框架基本分为三步：

首先，需要产生目标可能存在的感兴趣区域（Region of Interest，ROI）。因为一张图片中含有大量背景信息，一个可行的方法是先产生目标可能存在的大致区域，再对这些感兴趣区域进行微调。
对感兴趣区域提取特征，用于后续的分类及回归
在完成前两步后，我们会得到一系列包含目标的bounding box，但这些boxes有大量重合，所以需要对其进行筛选重组，如非极大值抑制（思想是将预测出的boxes数量减少到图片中真实目标的数目），使得每个目标由单一box框定

Fast-RCNN过程：

R-CNN的目标检测流程：
a) 输入图像，预训练CNN网络

b)用selective search预选出2000个候选框
c) 一整张图都输入到CNN模型中，提取到图片的整张feature map

d)通过坐标投影的办法，把候选区域映射到上一步的cnn模型中提取到的feature map，得到输入图像中的候选框对应的特征区域（卷积复用）

e)此时候选框的size不同，使用ROI pooling降采样使得候选框的特征区域size相同

f)将候选框的特征区域连接FC层，FC层分别与softmax分类器和bounding max分类器相连

g)得到类别及包围框，根据非极大值抑制得到最终结果

高斯灰度模型：

1.去噪

2.通过检测物的形状轮廓来判断它是什么种类

图像识别四大分类任务：

1.分类

2.定位

3.检测

4.分割。实例分割和场景分割

关注