细粒度图像识别
文章平均质量分 92
右边是我女神
笔记仓库
展开
-
蒸馏_2022
在目标检测当中,老师的特征和学生的特征在不同的区域有很大的变化,尤其是在前景和背景中。因此,如果我们平等地蒸馏,特征图之间的差异会恶化结果。(PS:目标检测中的蒸馏会比对教师模型和原模型的特征图)翻译:前景不好学,背景很好学,如果这两部分内容进行一样地教授,效果不大好。因此,我们提出了聚焦且全局蒸馏。聚焦蒸馏分割前景和背景,强迫学生关注教师的关键像素及通道;全局蒸馏则重建不同像素之间的关系,并将这一知识传递给学生。原创 2023-04-04 22:43:35 · 570 阅读 · 1 评论 -
细粒度图像分类论文研读-2019
目前的工作以一种弱监督的方式解决细粒度图像分类问题:首先检测对象部分,然后提取相应的部分特定特征以进行细粒度分类。然而,这些方法通常孤立地处理每个图像的部分特定特征,而忽略他们之间的关系。本文提出了Cross-X学习,这是一种简单而有效,它利用不同图像之间的关系以及不同网络层之间的关系来实现鲁棒的多尺度特征学习。一个跨类别的跨语义正则化器,它引导提取的特征来表示语义部分;一个通过匹配多个层的预测分布来提高多尺度特征鲁棒性的跨层正则化器;本文的目的是将细粒度认知的问题空间划分为一些特定区域。原创 2022-12-15 23:24:55 · 1183 阅读 · 0 评论 -
细粒度图像分类论文研读-2018
依赖于对象或者局部注释,这需要很大的工作量;忽略对象与其各部分之间的相互关系以及各部分之间的相互关系。第二个问题是目前新出现的。Object-part attention model集成了两级注意:对象级注意定位图像中的对象,部分级注意选择对象的判别部分。两者共同用于学习多视图和多尺度特征,以增强他们的相互促进。Object-part spatial constraint model结合了两个空间约束:对象空间约束确保所选部分具有高度代表性,部分空间约束消除冗余并增强对所选部分的判别。原创 2022-12-15 21:38:10 · 969 阅读 · 0 评论 -
细粒度图像分类论文研读-2022
目前的工作主要通过关注如何定位最具识别度的区域并依靠它们来提高网络捕捉细微变化的能力来完成FGVC。这些工作中的大部分是通过RPN模块来提出绑定框并重新使用主干网络来提取所选框的特征。近年来,ViT在传统分类任务重大放异彩,其自我关注机制将每个patch的token连接到分类token。注意力连接的强度可以被直观地视为表征重要性的指标。本文中,提出了一个新的、基于transformer的结构TransFG。本文将所有原始注意力权重聚合为一个注意力图来指导网络有效且准确地选择有区分度的图像块并且计算他们之间的原创 2022-12-08 04:16:45 · 3377 阅读 · 2 评论 -
细粒度图像分类论文研读-2020
大部分现存的注意力模型在FGVC任务当中表现不佳,原因有以下几点:为了解决上述问题,本文提出了一种新的“过滤和蒸馏学习”(FDL)模型,以提高FGVC细分部分的区域关注度。首先,基于提议和预测之间的匹配性,本文针对有区分度的区域提议提出了一种过滤学习的方法。特别地,本文用了提议与预测的匹配性作为RPN的性能度量,从而实现了RPN的直接优化,以过滤得到最具有区分度的区域。具体来说,基于对象的特征学习和基于区域的特征学习被定义为“教师”和“学生”,这可以为基于区域的学习提供更好的监督。FDL可以有效地提升区域关原创 2022-12-07 19:30:45 · 1218 阅读 · 0 评论 -
细粒度图像分类论文研读-2017
细粒度视觉分类任务的成功依赖于各种语义部分的外观建模和相互联系。这一特性使得FGVC任务非常具有挑战性,原因有三点:为了解决上述问题,本文提出了一个基于分层卷积激活的高阶积分的端到端框架。通过将卷积激活作为局部描述,分层卷积激活能够作为来自不同尺度的局部表示。(卷积激活是什么?为什么可以作为局部描述?)本文提出了一个基于多项式核的预测器,目的是为了捕捉高阶统计量,用于建模零件之间的相互作用。为了模拟层间零件之间的相互作用,本文扩展了多项式预测器,通过核的融合来集成层次激活。全连接网络并不适合FGVC,而CN原创 2022-12-04 22:15:02 · 1012 阅读 · 0 评论 -
细粒度图像分类论文研读-2016
双线性模型很成功,但是双线性特征是高维的。因此,本文提出了两种紧双线性表示,具有与双线性表示相同的辨别能力,但只有几千维。本文提出的紧凑的表示允许分类错误的反向传播。原创 2022-11-28 18:02:13 · 896 阅读 · 0 评论 -
核函数简介
把数据送到另一个空间(通常具有高的维度);在新的空间找到一个线性关系(可以将数据分开)。如果映射选择合适,复杂的关系能够被简化。映射空间的几何性质可以通过内积来表示;内积的计算是简单的。k:X×X→Rk:X×X→R满足有限正半定当且仅当对于有限个样本xxx,它的内积矩阵是一个正半定矩阵。另外,思考4和5对应定理:Characterization of Kernels。原创 2022-11-27 16:52:02 · 2251 阅读 · 0 评论 -
细粒度图像分类论文研读-2015
本文提出了双线性模型,由两个特征提取器组成。其输出在图像的每个位置使用外积相乘并合并来获得图像的描述。这样一种结构可以建模局部的、成对的特征交互(以一种平移不变的方式),这对于细粒度分类尤其有用。这样一种结构还会产生各种无序纹理描述,比如Fisher向量、VLAD和O2P。双线性形式简化了梯度计算并允许仅使用图像标签对两个网络进行训练。原创 2022-11-24 23:10:59 · 701 阅读 · 0 评论 -
细粒度图像分类论文研读-2014
语义部件定位能够有助于细粒度分类。姿态归一化表征的方法已经提出,但是由于目标检测的困难性,在测试阶段需要假定一些目标框。本文通过利用自下而上的区域建议方法计算得到的深度卷积特征来克服这一限制(大概意思是解决对目标框的依赖)。本文提出的方法学习了对整体和局部的检测器,加强了他们之间的几何约束,并且从一个姿态归一化的表征中预测细粒度类别。(什么是姿态归一化表征?为什么要采用姿态归一化表征?)原创 2022-11-08 15:52:19 · 814 阅读 · 2 评论 -
细粒度图像分类论文研读-2013
将人类纳入循环,帮助计算机选择有区分的特征。本文介绍了一款名为“Bubbles”的游戏,揭示了人类使用的判别性特征。玩家的目标是识别严重模糊的图像类别。在游戏中,玩家可以选择暴露圆形区域的细节并受到一定的惩罚。在适当的设置下,游戏能够生成具有质量保证的、有区分度的气泡。之后,本文提出了”Bubble Bank“算法,利用人类选择的气泡来提高机器识别性能。提出了功能强大的流程图,称之为分层部件匹配模块来处理细粒度分类任务。原创 2022-11-08 13:25:05 · 1056 阅读 · 0 评论 -
细粒度图像分类论文研读-2012
目前大部分对一般目标的分类方法在细粒度图像分类上都不好使。这主要归咎于codebook-based image representation。这导致了对细粒度分类至关重要的细节图像信息丢失。解决这个问题的一个方法是引入人工标注的对象属性或者关键点。本文提出了一种无codebook以及无注释的细粒度图像分类方法。不使用失量化的codewords,而是通过一个高吞吐量的模板匹配过程来获得图像表示。相关属性是局部的,但如何选择这些局部属性的问题在很大程度上没有得到探索。原创 2022-11-07 18:25:37 · 1029 阅读 · 0 评论 -
细粒度图像分类论文研读-2011
是CUB-200的扩充版本(扩充了图片数量、增加了位置标注【bounding boxes、part locations、attribute labels】)。本文的方法的目的是为了探索细粒度图像的统计数据与检测有区分度的图像块来进行识别。为了达到这一目的,应用了区分度特征挖掘和随机化两种手段。区分度特征挖掘可以建模有区分度的细节信息,而随机化可以解决大的特征空间和阻止过拟合。本文提出了基于判别树算法的随机森林,其中每一节点是一个分类器。值得一提的是,这一分类器的训练是和上层的节点一起进行的。原创 2022-10-31 14:18:14 · 575 阅读 · 0 评论