FashionSearchNet学习笔记

最新推荐文章于 2021-11-01 14:10:27 发布

木头吃日历

最新推荐文章于 2021-11-01 14:10:27 发布

阅读量312

点赞数

分类专栏：计算机视觉

本文链接：https://blog.csdn.net/lllsy_12138/article/details/105761239

版权

FashionSearchNet解决了图像检索中替换属性的问题，通过属性定位、确认、修改器和进一步优化实现高效检索。使用Alexnet结构进行属性定位，通过ROI Pooling和属性向量表示，结合排序损失函数进行训练，允许对图像属性进行修改。

摘要由CSDN通过智能技术生成

FashionSearchNet

（写了一半，现在认为，这种方法就是在AMNet的基础上添加了属性定位）
针对于图像检索中替换属性的问题，一个难点就在于如何表示产品中每个属性的特征。FSNet使用了一种弱定位的方法提取属性区域。通过这种方式，能够使不相关的部分不再对图像检索产生影响。

1. FSNet使用背景

有部分学者已经对如何替换图像中的属性做出了自己的研究，如AMNet。但是这些方法都没有从属性定位的方面进行探索。属性定位其实是由Learning Deep Features for Discriminative Localization这篇论文提出的,在本文中也得到了很好的使用。

2. FSNet核心要点

1. 属性定位

首先使用类似Alexnet的结构对图像进行属性定位。属性定位的方法来自于Learning Deep Features for Discriminative Localization。属性定位就是为了更好的表示一种属性。在神经网络中输入一张图片，通过Alexnet进行卷积，但将Alexnet的两个全连接层换成卷积层，并进行GAP操作，GAP公式如下：
$\sum_{k}(x_{I}(k)=\sum_{i,j}conv7_{k}(I,i,j))$
这里的 $x_{I}(k)$ 是图像 $I$ 中的第 $k$ 个通道， $conv7_{k}(I,i,j)$ 是第七卷积层中的第k个特征图的 $(i, j)$ 这个位置。进而我们可以定义属性激活图AAMs为：
$M_{a_{c}}(I,i,j)=\sum_{k}W_{a_{(k,c)}}conv7_{K}(I,i,j)$
这里的c是类别， $W_{a_{(k,c)}}$ 就是属性a在第k个特征图里属于类别c的权重。 $W_{a}$ 使用下述的分类损失函数进行更新：
$L_{c}=-\sum_{I=1}^{N}\sum_{a=1}^{A}log(p(g_{I_{a}}|x_{I}w_{a}))$