读论文,衣物检索:DeepFashion: Powering Robust ClothesRecognition and Retrieval with Rich Annotations

DeepFashion: Powering Robust ClothesRecognition and Retrieval with Rich Annotations(2016)

总体网络结构

fashionnet。对细粒度的属性指示性更强,所以有更好的表现。源自于所使用数据集中的landmark,可以提高衣物属性的指示作用。

衣物识别与检索的三大任务:

预测类别/属性

网店衣服检索

Consumer-to-shop衣服检索

衣物数据集该有的属性特征,以及DeepFashion的特点

衣物的数据集所包含的特征:

语义属性(颜色,种类,纹理),衣服位置(衣服掩膜),自拍变网店图片

本文提出的DeepFashion数据集特性:新增加了关键位置(领子,袖口)的landmark(bound ing box);有衣物的更多的属性。对此数据集总体来看:有大量属性,衣服的landmark,不同背景下拍摄的相同款式像对(consumer-to-shoppair correspondences)。

数据来源:衣服购物网站上1320k张图片,google搜索1273k张。使用AlexNet比对fc7相似度,去重复,又人工去除低分辨率,去不相关图片。最后得到800k张。

FashionNet:

对衣服变形遮挡,使用pooling/gating 特征图预测landmark

基础类似VGG16,最后一个卷积层为特别设计,替代为三个分支网络结构。分别是提取全局特征的层,红色表示;根据局部landmark位置pooling的层,绿色表示;预测landmark位置和可视度的层,蓝色表示。前两个分支再融合,预测衣服属性,类别,像对分析。

前向传播是,先是蓝色分支,得到landmark的位置;然后是绿色分支,对局部信息处理;最后是全局信息的红色分支;红和绿再融合处理。

Loss function:
regression loss用于landmark的回归框L2;

Softmax loss用于预测landmark的是否可见,衣物的类别——1-of-K;

Cross-entropy用于属性预测——y/n;

Triplet loss来度量成对衣物相似度 positive/negative。

训练时,先训练蓝色分支,红绿分支列为附属分支;然后进入第二步,整个网络一块训练。具体通过对loss设置差异巨大的权重实现,然后两步交叉迭代直至收敛。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值