Deep Learning based Large Scale Visual Recommendation and Search for E-Commerce

一篇用于相似物品的图片推荐的paper,github地址
网络结构如下所示
Deep Ranking CNN Architecture

图a展示的是整体的框架,每个VisNet具体细节如图b所示。
VisNet是具有两个分支:一个传统 的VGG16和一个浅层网络(kernel size 较大)
VGG16用于提取 high level/ abstract details
浅层网络用于提取 low level/fine-graind details

triplet loss也用于此。
(q,p,n)
a query image (q), a positive image (p) and a negative image (n)
The in-class triplets 让网络学会细微的差异,The out-of-class triplets让网络学会coarse-grained 差别。

测试的时候,是对每张图片直接提取图b中最后输出的feature vector,之后再用距离度量方式度量差异性。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值