自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Learning Spatial Regularization with Image-level Supervisions for Multi-label Image Classification

标签分类器:将经过空间正则化模块的特征图送入多个二元分类器中,每个分类器对应一个标签,输出该标签是否出现在图像中的概率。空间正则化模块:该模块旨在学习每个标签在图像中的空间位置,并将这些位置信息用于提高分类准确性。位置感知模块:学习每个标签在图像中的位置,它将特征图划分成若干个块,并在每个块中学习一个标签的位置权重。空间注意力模块:利用位置感知模块学习到的位置权重,对特征图进行加权,以提高每个标签的分类准确性。对新的向量进行 Sigmoid 操作,并与原始特征图进行元素级别相乘,得到增强后的特征图。

2023-05-16 21:52:41 59 1

原创 HCP: A Flexible CNN Framework forMulti-Label Image Classification的理解

为了抑制可能有噪声的假设,进行交叉假设最大池化操作,将共享CNN的输出融合为一个综合预测。使用最大池化,从那些包含对象的假设中得到的高预测分数被保留,而噪声的被丢弃。图像数据集(即ImageNet)上进行预训练,然后在目标多标签数据集(例如Pascal VOC)上进行微调,使用整个图像作为输入。4.HCP在softmax层之后产生标签上的归一化概率分布,预测的概率值本质上是相应类别的最终分类置信度。3.共享的CNN是灵活的,可以很好地使用大规模的单标签图像数据集进行预训练。

2023-05-09 15:50:29 96 1

原创 Multi-label Image Classification with Regional Latent Semantic Dependencies(RLSD)的文章理解

对于上图进行一个详细的解释:首先,对于图片使用VGG19实现特征提取,再将卷积特征传送到红色部分,也就是Fully Convolutional Localization Layer,在这个部分卷积特征图中的每个点被投影回原始图像(H × W),并进一步作为中心生成k个不同纵横比的锚盒。每个区域的特征被平展成一个向量,并通过这个全连接的网络。模型生成的边界框通常更大,其中一些包含多个对象,为了显示定位层的有效性,设置了一个基线模型,该模型使用MCG[45]来取代我们的多标签区域定位层以进一步进行多标签分类。

2023-05-08 08:38:26 207 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除