DeepContour论文笔记(CVPR2015)

摘要

这篇文章证明了使用从CNNs中学习到的深度特征可以提高轮廓检测的准确度。
对CNNs的训练采取二元变多元的策略,即提出把本来是二元分类问题的轮廓检测转化为一个多元分类问题,对每一个类使用不同的参数,区别对待。
同时为了获得更加有区分度的特征,提出了一个positive-sharing loss的损失函数,该损失函数引入了一个额外的正则化因子来强调 positive and negative classes(轮廓类和背景类)的区别。
实验结果在Berkeley Segmentation DatasetBSDS500数据集上达到了最好的准确率,同时在NYUD dataset上也取得了很高的准确度。

简介

轮廓检测的意义

自然图片的轮廓检测是非常基础的一个问题,它是图像分割、场景识别、目标检测的基础。就目标检测来说:
目标检测任务可分为两个关键的子任务:目标分类目标定位.目标分类任务负责判断输入图像中是否有感兴趣类别的物体出现,输出一系列带分数的标签表明感兴趣类别的物体出现在输入图像的可能性.目标定位任务负责确定输入图像中感兴趣类别的物体的位置和范围,输出物体的包围盒,或物体中心,或物体的闭合边界等,通常方形包围盒是最常用的选择.而这些都离不开对物体轮廓的准确检测。

什么是轮廓

边缘与线段包含丰富的图像信息, 代表了图像的特征, 边缘与线段的组合构成一幅图像区别于其他图像的特征集合。 物体的轮廓不同于边缘, 图像的边缘信息包含所有的轮廓信息, 轮廓包含着比位置更多的信息, 从图像的轮廓, 人们即可识别大量的物体。

轮廓检测的难点在哪里

难点在于怎样将物体本身的纹理和物体的轮廓区分开,因为纹理和物体的轮廓都会造成图像梯度的变化,对与计算机来说,这是很难区分的特征。

别人如何解决这个问题

传统的方法就是对每个图像像素,设计各种各样的梯度特征,在通过一个二元的分类器来决定该像素是否是轮廓。虽然传统的方法在过去的十几年当中,一直处于最好的准确率,但是对于语义上目标轮廓和急剧变化的纹理并没有很好的区分度。但是最近流行CNNs却表现出非常好的表现。
轮廓检测方面: P. Dollar 将随机森林用于轮廓检测,获得了real time级的速度以及达到了主流的准确率。Joseph J. Lim等人使用sketch tokens 学习轮廓的中间层特征并用于轮廓检测。Martin等人仔细设计了与自然边界相关的亮度,颜色和纹理的特征变化的features,并且让学习分类器来组合这些特征。
深度学习用于轮廓检测 Kivinen等人using RBM and classified multiple read-out layers。Ganin and Lempitsky首先让CNNs学习轮廓特征然后将学习到的特征输入到an annotation edge map using kd-tree。

作者如何解决这个问题的

作者想让CNNs学习到具有辨别力的特征,为此作者考虑到轮廓具有不同的特征和结构,所以对于不同的轮廓特征进行分类,采用不同的模型参数来表征。
由于轮廓之间的分类出错一般是可以忽略或者是容忍的,但是轮廓和背景之间分类出错是不可以容忍的,所以在loss function中强调了轮廓和背景出错所引起的费用,就是额外增加了轮廓错误分类到背景和背景错误分类到轮廓的费用。
通过以上这两个措施,从而让CNN学习到更加具有辨别力的特征。

具体实现

算法流程图

第一步:聚类

这里写图片描述
聚类的结果:
聚类结果

第二步:训练CNNs

训练CNNs)
深度特征可视化结果:
可视化结果

第三步:使用随机森林

这里写图片描述
最终输出结果:
轮廓图

CNN的结构

CNN的结构
COV1(45 × 45 × 32)→LRN1 → MAXP1 →COV2(22 × 22 × 48) → LRN2 → MAXP2 →COV3(10 × 10 × 64) → LRN3 → MAXP3 →COV4(4 × 4 × 128) → MAXP4 → FC1(128) →RELU→DROPOUT→ FC2(101)→a softmax classifier(51类)

费用函数

预测结果为类别j的置信度

公式一

一般的softmax classifier的loss function

公式二

引入额外的正则化因子后的loss function

公式三

实验结果

Berkeley Segmentation DatasetBSDS500数据集上达到了最好的准确率,同时在NYUD dataset上也取得了很高的准确度。
实验结果

PS:关于怎样使caffe网络可以接受任意大小的输入

我们都知道卷积操作是和输入图像的大小无关的,然而全链接层是和输入图像的大小关系的。因此,如果要可以接受任意大小的图像输入,我们可以将全链接层转变为卷积层,其他不变,这样就可实现接受任意大小图像输入了。具体实现请看这里

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
import cv2 as cv import numpy as np def scan_edge_demo(img): gray = cv.cvtColor(img,cv.COLOR_BGR2GRAY) gray = cv.GaussianBlur(gray,(3,3),0) scan_edge = cv.Canny(gray,60,150) return scan_edge def scan_contours(img): scan_edge =scan_edge_demo(img) aa,contours,b= cv.findContours(scan_edge,cv.RETR_TREE,cv.CHAIN_APPROX_SIMPLE) cv.drawContours(img,contours,-1,(0,255,255),thickness=4) cv.imshow("scan_contours",img) src = cv.imread("E:/opencv/picture/taijie.png") cv.imshow("inital_window",src) scan_contours(src) cv.waitKey(0) cv.destroyAllWindows() 图片: 分析: 1.Opencv发现轮廓的函数原型为:findContours(image, mode, method[, contours[, hierarchy[, offset]]]) -> image, contours, hierarchy image参数表示8位单通道图像矩阵,可以是灰度图,但更常用的是二值图像,一般是经过Canny、拉普拉斯等边缘检测算子处理过的二值图像。 所以输入源需要二值化(threshold)处理或者边缘处理canny后才行 mode参数表示轮廓检索模式: ①CV_RETR_EXTERNAL:只检测最外围轮廓,包含在外围轮廓内的内围轮廓被忽略。 ②CV_RETR_LIST:检测所有的轮廓,包括内围、外围轮廓,但是检测到的轮廓不建立等级关系,彼此之间独立,没有等级关系,这就意味着这个检索模式下不存在父轮廓或内嵌轮廓。 ③CV_RETR_CCOMP:检测所有的轮廓,但所有轮廓只建立两个等级关系,外围为顶层,若外围内的内围轮廓还包含了其他的轮廓信息,则内围内的所有轮廓均归属于顶层。 ④CV_RETR_TREE:检测所有轮廓,所有轮廓建立一个等级树结构,外层轮廓包含内层轮廓,内层轮廓还可以继续包含内嵌轮廓。 method参数表示轮廓的近似方法: ①CV_CHAIN_APPROX_NONE 存储所有的轮廓点,相邻的两个点的像素位置差不超过1,即max (abs (x1 - x2), abs(y2 - y1) == 1。 ②CV_CHAIN_APPROX_SIMPLE压缩水平方向,垂直方向,对角线方向的元素,只保留该方向的终点坐标,例如一个矩形轮廓只需4个点来保存轮廓信息。 ③CV_CHAIN_APPROX_TC89_L1,CV_CHAIN_APPROX_TC89_KCOS使用teh-Chinl chain 近似算法。 contours参数是一个list,表示存储的每个轮廓的点集合。 hierarchy参数是一个list,list中元素个数和轮廓个数相同,每个轮廓contours[i]对应4个hierarchy元素hierarchy[i][0] ~hierarchy[i][3],分别表示后一个轮廓、前一个轮廓、父轮廓、内嵌轮廓的索引编号,如果没有对应项,则该值为负数。 offset参数表示每个轮廓点移动的可选偏移量。 2.Opencv绘制轮廓的函数原型为:drawContours(image, contours, contourIdx, color[, thickness[, lineType[, hierarchy[, maxLevel[, offset]]]]]) -> image imgae参数表示目标图像。 contours参数表示所有输入轮廓。 contourIdx参数表示绘制轮廓list中的哪条轮廓, 如果是负数,则绘制所有轮廓。 color参数表示轮廓的颜色。 thickness参数表示绘制的轮廓线条粗细,如果是负数,则绘制轮廓内部。 lineType参数表示线型。 hierarchy参数表示有关层次结构的可选信息。 maxLevel参数表示绘制轮廓的最大级别。 如果为0,则仅绘制指定的轮廓。 如果为1,则该函数绘制轮廓和所有嵌套轮廓。 如果为2,则该函数绘制轮廓,所有嵌套轮廓,所有嵌套到嵌套的轮廓,等等。 仅当有可用的层次结构时才考虑此参数。 offset参数表示可选的轮廓偏移参数,该参数可按指定的方式移动所有绘制的轮廓。 关于轮廓检测,什么的样的情况会被判断为轮廓呢? 答:因为在做轮廓检测之前需要进行二值化,所以对于图像的整个ROI区域只有黑白两个颜色,而下面两种情况会被检测作为轮廓: 1. 白色区域与黑色区域的边缘交接区域 2. 当背景为白色时,整个ROI区域的外边界就会被视为轮廓。(往往我们希望背景是黑色,所以如果出现这种情况时我们需要在二值化图像时对图像取反)。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值