[论文笔记]弱监督条件下基于相似性条件学习的服饰搭配生成

最新推荐文章于 2021-12-24 16:10:41 发布

spearhead_cai

最新推荐文章于 2021-12-24 16:10:41 发布

阅读量528

点赞数

分类专栏：论文阅读深度学习文章标签：深度学习计算机视觉服饰搭配论文笔记

本文链接：https://blog.csdn.net/lc013/article/details/115793084

版权

论文：《Learning Similarity Conditions Without Explicit Supervision》

论文地址：https://arxiv.org/pdf/1908.08589.pdf

代码地址：https://github.com/rxtan2/Learning-Similarity-Conditions

本文首发于 https://mp.weixin.qq.com/s/WHnYNvWWkPmqh1HrytCHqg

联系方式：

Github：https://github.com/ccc013

微信公众号：AI 算法笔记

在这里插入图片描述

目前搭配方面的工作都比较依赖于多种相似条件，比如在颜色、类型和形状的相似性，通过学习到基于条件的 embedding，这些模型可以学习到不同的相似信息，但是也受限于这种做法以及显式的标签问题，导致它们没办法生成没见过的类别。

所以，本文希望在弱监督的条件下，将不同的相似条件和属性作为一个隐变量，学习到对应的特征子空间，如下图所示，对比了本文的方法和先前的一些工作。

先前的工作需要用户定义的标签来学习不同相似性的特征子空间，比如上衣和裤子的子空间，或者裤子和鞋子的子空间。而对于本文的方法来说，并不需要这些显式的标签来学习特征子空间。

本文是提出了一个相似条件向量网络（Similarity Condition Embedding Network，SCE-Net）模型从一个统一的向量空间中联合学习不同的相似条件，一个整体结构示意图如下所示：

每张图片会经过一个 CNN 网络，然后映射到统一的向量空间中
该网络比较核心的部分是一系列平行的相似条件 masks，即图中的 $C_1, C_2，\cdots, C_M$ ，这些 masks 是通过图中的条件权重分支所学习到的；
图中的条件权重分支可以被看做是一种 attention 机制，对正在进行比较的对象，动态分配每种条件 mask；

本文的贡献归纳如下：

这部分将介绍本文提出的 SCE-Net 模型，它是在一个弱监督条件下，将不同的相似条件以及属性当做隐变量，从而学习到对应的特征子空间。

首先输入的图片将输入到 CNN 中提取特征，这里我们用 $g(x;\theta)$ 进行表示，其中 x 表示输入图片，而 $\theta$ 表示模型参数。本文的网络主要包含两个部件：

这会在接下来的两个小节里分别介绍，然后第三小节会介绍在不同输入形式下，条件权重分支的变形。

本文的模型的一个关键组件就是一组 M 个平行的相似条件掩码，记作 $C_1, C_2,\cdots,C_M$

关注