多类别属性预测深度架构GlideNet

2022cvpr多类别属性预测深度架构GlideNet
摘要由CSDN通过智能技术生成

将属性(如颜色、形状、状态、动作)附加到对象类别是一个重要的计算机视觉问题。属性预测最近取得了令人振奋的进展,通常被表述为一个多标签分类问题。然而,在以下方面仍然存在重大挑战:1)预测多个对象类别上的大量属性,2)建模属性的类别依赖性,3)系统地捕获全局和局部场景上下文,以及4)稳健地预测低像素数对象的属性。为了解决这些问题,我们提出了一种新的多类别属性预测深度架构GlideNet,该架构包含三个不同的特征提取器。全局特征提取器识别场景中存在的对象,而局部特征提取器则关注感兴趣对象周围的区域。同时,内部特征(实例特征)提取器使用标准卷积的扩展,称为通知卷积,以利用其二进制掩码检索低像素数对象的特征。GlideNet然后使用带有二进制掩码的选通机制及其自学习类别嵌入来组合密集嵌入。总体而言,全局-局部内在块理解场景的全局上下文,同时关注感兴趣的局部对象的特征。该架构通过类别嵌入来适应基于类别的特征组合。最后,使用组合特征,解释器预测属性,输出的长度由类别决定,从而删除不必要的属性。

创新点:

1. 采用了三种不同的特征抽取器;每个都有特定的目的。全局特征提取器(GFE)捕获全局信息,封装图像中不同对象的信息(它们的位置和类别类型)。局部特征抽取器(LFE)捕获局部信息,封装与对象属性及其类别和二进制掩码相关的信息。最后,实例特征提取器(IFE)封装了有关对象固有属性的信息。它确保我们仅从对象的像素估计特征,不包括其

  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值