论文阅读理解 - DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations

DeepFashion 数据集提供丰富标注,包括类别、属性、关键点等信息,用于服装识别和检索。FashionNet 网络通过联合预测属性和关键点,使用关键点池化层增强形变处理能力。该文详细介绍了数据集的特性、网络结构及反向传播过程,旨在推动服装识别和检索技术的发展。
摘要由CSDN通过智能技术生成

DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations

[Paper]

[Project]

[Dataset]

[fashion-detection-Code]

1. DeepFashion Dataset

  • 综合性强(Comprehensiveness) —— 标注信息包括:50 fine-grained categories, 1000 attributes, landmarks, bounding box, 300000 cross-pose/cross-domain pair correspondences.
  • 规模大(Scale) —— 超过 800K 标注的服装图像
  • 可利用性好(Availability) —— 对研究性应用公开.
    这里写图片描述

针对服装识别和检索,数据标注主要考虑三个方面:

  • 大规模属性(Massive attributes) - 对于服装商品识别必须的信息;
  • 关键点(Landmarks) - 关键点位置能够有效处理形变和姿态变化;
  • 买家与商家对(Consumer-to-shop pairs) - 建立 cross-domain gap 的桥梁.

DeepFashon 数据集用途:

  • 类别与属性预测(Category and Attribute Prediction)
    该任务是对 50 个fine-gained 类别和 1000 个属性进行分类. 共 63720 张标注图片.

    • 对于类别分类,采用标准的 top-k 分类精度 作为评价准则; 1-of-K classification problem.
    • 对于属性预测,采用 top-k recall rate 作为评价准则,通过对 1000 个分类 scores 进行排名,检测在 top-k 中所匹配的属性数量; multi-label tagging problem.
  • 商家服装检索(In-Shop Clothes Retrieval)
    该任务是判断两张商家图像是否属于同一款. 共 11735 款服装,54642 张图片(From Forever21).
    采用 top-k 检索精度作为评价准则,如果在 top-k 检索结果中能够精确找到服装款,则认为是检索正确.

  • 买家到商家服装检索(Consumer-to-Shop Clothes Retrieval)

    该任务是匹配买家所拍照片与商家的服装. 251361 张买家与商家对{From Mogujie).
    采用 top-k 检索精度作为评价准则.

2. FashionNet

通过联合预测服装属性 (clothing attributes) 和关键点(landmarks) 来学习服装特征. 再利用估计的关键点位置来池化(pool/gate) 学习的特征. 以迭代的方式进行.

2.1 网络结构

基础网络采用 VGG16 . 从开始到倒数第二层,与VGG16相同,最后一个卷积层重新设计用于服装问题. 如图:
这里写图片描述
Figure 5. FashionNet 结构. 包括全局特征分支(橙色部分),局部特征分支(绿色部分),pose 分支(蓝色分支). 其中,忽略了共享卷积层.

全局特征分支—— 整个服装商品的全局特征;

局部特征分支—— 由估计的服装关键点池化(pooling) 得到服装的局部特征;

Pose分支—— 预测关键点位置及其可见性(可见性指,关键点是否存在).

橙色分支和绿色分支的输出在 fc7_fusion 层连接,以联合预测服装类别、属性,对服装对建模.

2.2 前向传播(Forward Pass)

FusionNet 主要包括三个阶段:

  • Stage 1 - 服装图像输入网络,并在蓝色分支传递,以预测关键点位置;
  • Stage 2 - 在 pool5_local 层对估计的关键点进行池化(pooling or gate)特征,以使布局特征对服装形变和缺失具有不变性;
  • Stage 3 - 在 fc7_fusion 对 fc6_global 层全局特征和 fc6_local池化后的关键点局部特征进行连接.

2.3 反向传播(Backward Pass)

FusionNet 有四种损失函数,以迭代方式进行.

四种损失函数主要是:

  • 关键点定位的 regression loss;

    L2 regression loss:
    Llandmarks=|D|j=1||vj(lˇjlj)||22 L l a n d m a r k s = ∑ j = 1 | D | | | v j ⋅ ( l ˇ j − l j ) | | 2 2

    D D - 训练样本数;

  • 2
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DeepFashion是一个大规模的衣服服装数据集,用于衣物检索、时尚推荐、虚拟试衣等任务。该数据集包含超过80万张图片,涵盖了13个类别的衣物,包括上衣、裤子、裙子、鞋子等。每张图片都有详细的标注信息,包括类别、颜色、款式、属性等。 DeepFashion数据集的主要特点包括: 1. 大规模:DeepFashion数据集包含了大量的衣物图片,可以满足各种衣物相关任务的需求。 2. 多样性:数据集中的衣物涵盖了多个类别和款式,适用于不同的时尚风格和场景。 3. 详细标注:每张图片都有详细的标注信息,包括类别、颜色、款式、属性等,方便进行衣物检索和推荐等任务。 4. 高质量:DeepFashion数据集中的图片都经过了精心筛选和处理,保证了数据的质量和可用性。 使用DeepFashion数据集可以进行多种任务,例如: 1. 衣物检索:根据用户提供的图片或描述,从数据集中找到相似的衣物。 2. 时尚推荐:根据用户的喜好和场景,推荐合适的时尚搭配和衣物款式。 3. 虚拟试衣:通过虚拟现实技术,让用户在虚拟环境中试穿不同的衣物款式。 如果你想了解更多关于DeepFashion数据集的信息,可以参考以下引用[^1]: 引用: Liu, Ziwei, et al. "Deepfashion: Powering robust clothes recognition and retrieval with rich annotations." Proceedings of the IEEE conference on computer vision and pattern recognition. 2016.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值