阅读“细粒度图像识别关键技术研究”

细粒度识别的对象是区分同一类别下的不同子类别物体;细粒度图像识别的物体具有相似的形状和纹理,物体间的差异非常细微

1.    研究现状背景概括
细粒度识别中所采用的目标定位可以分为两类:一类是关键点定位,一类是区分性区域定位。
1.1.    关键点定位
关键点定位是在图像中寻找并定位预定义物体关键点,主要应用于人脸关键点检测、人体姿态估计和骨骼关键点定位。原理也就是求解图像I到关键点L的映射φ(就是求这俩个集合之间的函数关系)。在之前的研究中主要提出了基于回归的方法、基于热力图的方法和基于图网络的方法。
1.1.1    基于回归的方法
就是把关键点转化为坐标数值的回归问题,这种方法通常由单阶段或多阶段网络,每阶段通过修改原始卷积神经网络的全连接层实现,最终网络输出为k个关键点的2k个坐标数值。Toshev提出DeepPose,将关键点定位转化为坐标数值问题。Fan提出双流网络的方法(从图像整体和图像块(比如把256*256的图像分为好多个8*8的图像块)俩个尺度)。Pfister采用AlexNet结构网(Alexnet的整个网络结构是由5个卷积层和3个全连接层组成的,深度总共8层。),也就是拆分图像或视频的每一帧然后进行回归。Sun等人基于ResNet50网络(将靠前若干层的某一层数据输出直接跳过多层引入到后面数据层的输入部分。
意味着后面的特征层的内容会有一部分由其前面的某一层线性贡献。)提出一种结构感知方案。Lv等人提出俩阶段关键点回归问题,可以实现高分辨率人脸图像上的精细关键点定位。Valle等人基于循环神经网络,设计了多层级联回归方法,实现了人脸关键点定位。
这种基于回归的关键点定位方法是早先的主流方法,局限性在于:1.神经网络具有平移不变性(不变性意味着即使目标的外观发生了某种变化,但是你依然可以把它识别出来。这对图像分类来说是一种很好的特性,因为我们希望图像中目标无论是被平移,被旋转,还是被缩放,甚至是不同的光照条件、视角,都可以被成功地识别出来),所以对关键点空间位置感知较弱。2.受网络正则化(任何减小模型泛化误差的方法都可视为正则化)的影响,神经网络在回归任务上对小数值相对准确,对长距离的回归精度较差。
1.1.2    基于热力图方法
基于热力图的方法将关键点定位任务转化为每个关键点在图像中概率分布的估计任务,从他的发展现状上来看,基于热力图的方法适合于人体姿态估计特征提取。汤普森等人最先发现了该项应用。
Wei则从该思想上提出了多阶段从粗到细的多阶段热力图估计方法,实现复杂场景和遮挡场景实现精确定位。Toshev等人设计了多层级联中继监督的方案,采用堆叠沙漏结构,每一个沙漏网络预测关键点分布热力图ÿ

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值