Learning Hierarchical Features for Scene Labeling

基本情况

这是PAMI2013的一篇文章,作者是LeCun等人,所属领域是Image Segmentation.

Abstract

本文提出了一种多尺度CNN,并且结合超像素的最佳覆盖,实现语义分割。在Sift Flow(33类)和Barcelona DataSet (170类)打破记录,在Stanford Background Dataset(8类)接近记录。产生320 ×240图像标签不到一秒钟。

两个问题

在场景解析的背景下,有两个主要的重要问题:如何产生视觉信息的良好内部表示,以及如何使用上下文信息来确保解释的自我一致性. 本文的主要使用深度学习的方法解决上述的两个问题,主要想法是在一个大输入窗口上使用卷积网络操作产生每个像素位置的标签预测.卷积神经网络本身通过多个阶段的卷积、非线性激活、空间pooling来实现end-to-end的训练,从而自动学习分级特征表示.
但是,通过一个小的区域(卷积核大小)来标注每个像素比较困难.因为,一个像素的分类可能有的时候依赖于相对short-range的信息,例如人脸的存在可能暗示人身体的存在;来有的时候需要依赖long-range的信息,确定一个像素属于公路需要大范围的信息;为了解决这个问题,本文提出了使用multi-scale卷积神经网络.


经典的分割方法一般是先使用基于图的方法产生分割的侯选块,然后使用engineered特征进行对候选分割区域的编码.最后使用CRF或者其他的图模型训练来产生每个候选块的标签,来保证标签的全局一致性.本文通过大的上下文窗口可以不使用复杂的后处理且能确保标签一致性.

框架

本文提出的方法架构如下图所示:
1
上述架构主要由两部分组成:
(1)Multi-scale卷积表示.不同的尺寸对应的网络是权值共享的,其实是同一个网络的copy,输入的图片是输入图片的Laplacian pyramid的不同尺寸.这种方法可以被学习被高效的进行场景中的物体和区域的检测和识别,但是无法找到区域的精确边界,因此需要后处理来勾勒.
(2)Graph-based classification.
考虑了三种方法来产生最终的图片标注:1.Superpixels.通过在卷积特征向量上训练pixelwise分类器,使用简单的投票方法来指定每一个superpixles的标签.这种方法是fixed-level,因此效果不太理想.(2)CRF over superpixels.在superpixel基础上使用CRF,避免判别结果超出常规.但是这种对本文来说不是必须的,因为multiscale feature使得大多数的scene-level关系已经被捕捉到了.(3)Multilevel cut with class purity criterion.也就是使用一族的方法方法进行分割,比如同一方法使用不同参数等.

总结

本文使用多尺度的CNN进行语义分割,这是目前比较常用的做法。但是,在作者看来, 逐像素分类的精度无论如何都是不准确的,识别稀有的物体往往比精确标注天空的每一个边界的像素更重要
  

增量学习是指通过转移学习和分层顺序学习的方法实现的一种学习策略。在传统的机器学习中,传统的学习算法需要重新从头开始训练,无法将之前学到的知识应用到新的任务中。而增量学习通过引入转移学习和分层顺序学习的方式,可以在新任务出现时,充分利用之前学到的知识,从而更高效地进行学习。 转移学习是指将已经学到的知识和经验应用于新任务中的一种学习方法。在增量学习中,通过将之前学到的模型参数或者表示转移到新任务中,可以减少新任务的学习时间和数据需求。这种方法可以通过共享模型参数、特征表示或者预训练模型等方式来实现。通过转移学习,可以将之前学到的知识迁移到新任务上,从而更快速地学习到适应新任务的模型。 分层顺序学习是指根据任务的复杂程度和关联性,将学习任务分解成多个层次,并按照一定的顺序进行学习的一种学习方法。在增量学习中,可以首先学习简单的任务,然后逐渐增加任务的复杂程度和关联性。通过分层顺序学习,可以逐步建立起一个完整的模型,并且利用之前学到的知识和经验来帮助学习更加复杂的任务。这种方法可以减少新任务的学习难度,提高学习效果。 综上所述,增量学习通过转移学习和分层顺序学习的方法,可以在新任务出现时,充分利用之前学到的知识,从而更高效地进行学习。通过转移学习可以将之前学到的知识迁移到新任务上,从而更快速地学习到适应新任务的模型;通过分层顺序学习可以逐步建立起一个完整的模型,并且利用之前学到的知识和经验来帮助学习更加复杂的任务。这种学习策略可以提高学习的效率和准确性,对于实际应用具有重要的意义。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值