Condition-CNN 论文学习记录

论文来源:journal homepage: www.elsevier.com/locate/eswa

论文标题:Condition-CNN:Ahierarchicalmulti-labelfashionimageclassification
model

1.对于多标签任务分类历史研究

 基本就是用修改的VGG16,VGG16是2+2+3+3+3,但是BCNN每个block就是2个conv层,2个BN层,一个MAXPOOLING层,总共4个block。

2.condition-cnn架构

                                                              这是在训练时的模型 

需要用标签数据,但是引入了CPWM(条件概率权重矩阵):相对来说比较重要的创新点。

对于理解CPWM需要有概率论的知识,首先提出了P(A)

 P(A)其实就是贝叶斯公式中的归一化证据因子。

        

 

 其中P(A=aj)是细粒度类为j的概率,P(B=bi)是粗粒度类为i的概率,因为细粒度的分类为J,粗粒度的分类为I,所以CPWM矩阵为I*J。其中每一行相加为1(也是用到贝叶斯定理)

证明如下:

最初的CPWM是由父粒度生成的独热编码,将CPWM变成可训练的。 

再通过softmax的输出为父粒度的概率

 再将V和CPWM相乘得到:

 

 这是推理定义的条件CNN,首先通过真值来训练CPWM,然后再将训练后的CPWM作为test,为定值,在test上是将前一个softmax的输出乘以CPWM。

3.损失函数

对于三个分支都使用的是交叉熵函数,但是三个loss的损失权重是随时间变化的,epoch越往后,对于细粒度的权重就越高。

大致思路就是这样,代码地址:GitHub - bKolisnik/Condition-CNN

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值