细粒度识别——LIO方法概述

最新推荐文章于 2024-07-30 23:59:56 发布

Paul-LangJun

最新推荐文章于 2024-07-30 23:59:56 发布

阅读量2.9k

点赞数

分类专栏：神经网络机器学习文章标签：细粒度 LIO 图像分类

本文链接：https://blog.csdn.net/gaoxueyi551/article/details/121013372

版权

神经网络同时被 2 个专栏收录

45 篇文章 10 订阅

订阅专栏

机器学习

35 篇文章 4 订阅

订阅专栏

LIO（Look-into-object）方法通过目标范围学习（OEL）和空间上下文学习（SCL）实现细粒度分类，无需额外标注。OEL自监督学习目标范围，SCL建模目标内部结构。两者协同工作，提升分类性能，尤其适用于柔性物体分类。

摘要由CSDN通过智能技术生成

一、概要

和细粒度识别中的DCL方法不同，LIO（Look-into-object）方法的作者认为仅仅通过学习不同种类物体的可区分视觉模式进行分类是不严谨的，更重要的是要对物体的整体结构进行建模，这是从视觉机制得到的启发：人类在看到目标后，首先是锁定目标的范围，然后在目标所在范围内分析目标的内部结构特征，进而做出判断。基于此，提出了OEL（目标范围学习）和SCL（空间上下文学习）两个可插拔的学习模块，来实现细粒度目标分类。

同时，LIO方法无需额外的标注工作量，通过自监督的方式实现了OEL和SCL模块的学习。最终的推理阶段，OEL和SCL模块可以完全去掉，几乎没有额外的推理开销。

二、架构

图1是LIO的概要图，输入经过骨干网提取特征映射，特征映射分别输入OEL和SCL模块进行学习，两个模块共同促进骨干网学习定位对象和对象内部区域的相对位置。

图2是LIO的网络结构。1、绿色区域是Backbone，负责预测输出类别标签，同时输出的特征映射分别接入OEL和SCL模块；2、蓝色区域表示OEL模块，其输出一个Mask接入到SCL模块；3、灰色区域是SCL模块，同时接收到Backbone和OEL的Mask输入。注意：橙色虚线仅在前向传播时起作用，反向传播时是不起作用的。

三、OEL

Object Extent Learning，用于学习定位目标的大致范围，学的好与坏将直接关系到最终分类的性能。确定目标范围一般需要事先进行标注，然后进行训练，但这样做成本很大。OEL另辟蹊径，为了学习图像 $I$ 中目标的范围，它通过采样一定数目与 $I$ 同类别的图像，并进行计算得出一个语义Mask，该Mask矩阵反映了目标的大致范围，实现了自监督学习。流程如下：