【论文阅读】Real-time Personalization using Embeddings for Search Ranking at Airbnb

最新推荐文章于 2021-05-23 17:46:57 发布

Q1du

最新推荐文章于 2021-05-23 17:46:57 发布

阅读量579

点赞数

分类专栏：论文阅读推荐系统文章标签：推荐系统机器学习论文阅读 Airbnb

论文阅读同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

推荐系统

1 篇文章 0 订阅

订阅专栏

会议：KDD2018，4篇Best Paper之一
作者：来自Airbnb的Mihajlo Grbovic和Haibin Cheng
关键词：Search Ranking; Personalization; Embedding

这篇工作的基础部分可以认为是word2vec在推荐领域的应用。word2vec对word进行embedding，本文对User与Listing进行embedding。embedding后的向量和word2vec的结果一样，被赋予了意义，能够衡量在空间中的距离。这个空间在word2vec中是语义空间，在本文中可以被看做是用户(User)对产品(Listing)的兴趣空间。

文中的Embedding可以分为两块：

短期即时的个性化，Listing embeddings
长期个性化，User-type & listing type embeddings

Listing embeddings for short-term real-time personalization and user-type & listing type embeddings for long term personalization.

Listing Embedding

在这里插入图片描述
图1表示了一个以L_i为中心的点击序列。这部分的基本思路是Skip-gram Model。

Skip-gram Negative Sampling(SGNS)

所需最大化的目标函数为：
在这里插入图片描述
$m$ 是选定的中心前后窗口的长度。 $P(L_j|L_i)$ 的公式如下(Softmax)：

偏导 $P(l_j|l_i)$ 的时间复杂度 $O (n)$ 太高，因此使用负采样的方法来简化。负采样是指把Softmax替换成：
$P(l_j|l_i) = \sigma(u_i^{T}v_j)\prod_{k=1}^N \sigma(-u_i^Tv_k)$
其中， $\sigma(x) = {1\over{1+e^{-x}}}$ ， $N$ 决定了在每一个正样本中采多少负样本。因此，公式1所示的目标函数可以被改写为：
在这里插入图片描述
作者依据Airbnb的业务特点对公式3做了2点补充，相当于多目标融合策略。所加的两项含义如下：

第三项：将Booked List作为global Context（毕竟实际业务不能只看CTR，还要以CVR为导向）；
第四项：由于 $D_n$ 和 $D_p$ 极有包含不同的Listing，故再从Listing $l$ 的Market中做负采样。

对于冷启动问题采用K近邻的思路解决(K=3)。可以覆盖98%的冷启动样本。

User-type & Listing-type Embeddings

未完待续…

Q1du

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【论文阅读】Real-time Personalization using Embeddings for Search Ranking at Airbnb

会议：KDD2018，4篇Best Paper之一作者：来自Airbnb的Mihajlo Grbovic和Haibin Cheng关键词：Search Ranking; Personalization; Embedding这篇工作的基础部分可以认为是word2vec在推荐领域的应用。word2vec对word进行embedding，本文对User与Listing进行embedding。emb...
复制链接

扫一扫