摘要
面对海量的服装图像数据,如果使用人工进行服装图像的语义属性标注以用于分类和检索,则需要花费大量的人力和时间,而且语义属性并不能完全表达服装图像中的丰富信息,造成检索效果不佳。
针对服装图像对多个属性同时进行分类和识别的要求,构建了基于多任务学习的卷积神经网络结构。为了克服背景、光照、变形等因素的影响,采用了结合度量学习的卷积神经网络结构,具体包括Siamese和Triplet两种模型结构。实验结果表明,度量学习的引入,特别是采用Triplet结构,可以显著提高分类的准确性。
之后使用训练好的卷积神经网络进行特征提取用于图像检索,并和基于SIFT特征的检索方法进行比较。实验结果表明,检索时使用卷积神经网络提取的特征相比于传统的SIFT特征具有明显的优势,特别是基于Triplet结构的卷积神经网络的抗干扰能力显著提高。此外,融合卷积层和全连接的特征映射作为特征表示也比使用单一的特征映射具有更好的效果。为了更进一步消除背景因素的影响,还使用Faster-RCNN算法进行衣物检测以提取出感兴趣的区域。
最后为了提升检索速率,采取了两种可行的方法,一是K-means聚类,二是使用语义属性预测进行预分类,实验结果表明使用K-means的效果更好。
之后使用训练好的卷积神经网络进行特征提取用于图像检索,并和基于SIFT特征的检索方法进行比较。实验结果表明,检索时使用卷积神经网络提取的特征相比于传统的SIFT特征具有明显的优势,特别是基于Triplet结构的卷积神经网络的抗干扰能力显著提高。此外,融合卷积层和全连接的特征映射作为特征表示也比使用单一的特征映射具有更好的效果。为了更进一步消除背景因素的影响,还使用Faster-RCNN算法进行衣物检测以提取出感兴趣的区域。
最后为了提升检索速率,采取了两种可行的方法,一是K-means聚类,二是使用语义属性预测进行预分类,实验结果表明使用K-means的效果更好。