基于多因素的搭配推荐模型

h_k10086

已于 2023-02-17 21:04:04 修改

阅读量977

点赞数

文章标签：人工智能机器学习 python

于 2018-07-22 08:43:01 首次发布

原文链接：https://mp.csdn.net/mp_blog/creation/editor/81151455

版权

1）相互搭配的商品是可以在多个因素上近似的，比如款式、材质、印花、颜色等，而用风格这一个概念来概括就显得有些粗糙。

2）可以与一个主商品进行搭配的pair商品也可以是多种风格的，比如一件T恤可以跟不同风格的下装搭配，搭出运动、休闲、淑女等不同的风格。

基于这两种不同的思路，可以采用不同的两种方式进行建模。

1. Learning Compatibility Across Categories for Heterogeneous Item Recommendation

这篇paper提出一种方法：Mixtures of Non-Metric Embeddings for Recommendation, 简称Monomer，是为了对multiple localized notions of relatedness进行建模，即搭配的商品pair之间是可以有多种方面的因素的，而之前的搭配建模方式是只能学习到global notion of relatedness，这也是这种方法能够产出多样性搭配推荐结果的关键点。

建模方式：

1）Low-rank Mahalanobis Metric

将E看作是商品原始向量到latent space向量的映射关系，则映射后商品pair之间的距离是

2）Multiple, Non-Metric Embeddings

因为考虑到相互搭配的商品是可以在多个因素上近似的，比如款式、材质、印花、颜色等，而用风格这一个概念来概括就显得有些粗糙。所以可以有多个E，即用Ek来表示，每个Ek可以看作是一种特征提取的方式。其中第k种映射空间上，商品pair之间的距离为：

3）Probabilistic Mixtures of Embeddings

将N种映射方式上的预测距离加权求和，那么权重如何确定呢？考虑到非对称的设定，应该主要与主商品的特征相关。如下：

where U is a newly-introduced F*N parameter matrix with U:;k being its k -th column.

最终，商品pair的距离为：

模型训练：

采用最大似然估计的方式计算loss并进行模型训练。

2. Compatibility Family Learning for Item Recommendation and Generation

这篇paper同样是基于多因素进行搭配关系的建模，但与上一篇paper不同的是，主要假设是：可以与一个主商品进行搭配的pair商品可以是多种风格的。

paper提出了一种end-to-end的模型，将每个item映射到latent space上的K+1的向量，其中1个向量代表该item，另外K个向量代表该item的K个compatible prototypes，这些prototypes反应了搭配建模中的多样性，即可以与一个主商品进行搭配的pair商品可以是多种风格的。这K+1个向量即是该item的 compatibility family。

建模方式：

1）Projected Compatibility Distance

PCD是用于衡量两个商品之间的搭配关系的。

每个item可以被E0映射为一个向量；另外还可以被Ek(k=1,2,...,K)映射为K个向量，每个向量都靠近与其搭配的商品所组成的cluster。PCD的计算方式如下：

用图来表示的话：

2）最大似然估计

Ek(k=1,2,...,K)的大多数网络层参数都是共享的，只有最后一层参数是独立训练的。

使用最大似然估计进行建模：

模型训练：

美福知识百科全书http://www.china-meifu.cn 诚笃生活心得小知识http://www.chengdu-japan.com 森威体育生活知识http://www.sw-sports.cn

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。