标签个性化数据在推荐排序中的应用

最新推荐文章于 2021-05-06 08:40:03 发布

ruidu

最新推荐文章于 2021-05-06 08:40:03 发布

阅读量1.2k

点赞数

分类专栏：个性化算法

个性化算法专栏收录该内容

2 篇文章 0 订阅

订阅专栏

标签个性化数据在推荐排序中的应用

导读

“个性化是这个时代最耀眼的特征，谁能更好更快的抓住用户的个性化需求，谁就将赢得商业的未来”——《个性化，商业的未来》

本文share的这个项目，是我们在个性化推荐上的一个小小的尝试。通过捕捉用户实时的标签快速捕捉用户兴趣变化，用机器学习算法挖掘用户兴趣与实际消费行为的联系，及时调整推荐排序，提高推荐效果。

一、背景

2013年推荐还能实现效果100%的增长吗？

推荐从无到有，除了大盘增长带来的推荐成交自然增长外，基于协同过滤的推荐效果相比热销效果翻了一番。随着协同过滤技术的普及，推荐增长速度已经明显放缓，急需寻找新的突破点提升效果。

个性化的声音此起彼伏，我们团队也开始考虑使用个性化的方案，一方面通过捕捉用户的个性化的信息，更及时的了解用户兴趣点；另一方面，尝试各种个性化推荐匹配思路，希望给用户带来更好的推荐体验。这个case在这两个方面都做了尝试，从效果数据上看有明显提升。

二、个性化解决方案

个性化的核心问题是：用户的个性化信息挖掘和个性化信息的应用。

在这个项目启动之前，我们个性化上的尝试还是基于用户的历史信息，难以反应用户快速的兴趣变化；在个性化信息的应用上，缺少统一应用方式，往往是一个情景一种思路，通过人工定规则，难以保证效果且耗费资源。

捕捉用户实时个性化信息，快速捕捉用户兴趣变化；并基于用户反馈的方式应用个性化信息于推荐，是本期项目的两个关键点。现在，用户个性化信息实时捕捉->基于反馈的个性化信息应用->推荐效果提升，已经成为我们优化推荐资源位的一套科学方法论。

1、用户实时信息捕捉：

用户的实时信息虽然有多种多样，但基本上都是来自于用户实时的行为和行为作用的商品/品牌实体上。抛砖引玉，这里我们以商品为例，通过用户访问的商品及商品的标签信息来表达用户的实时信息。

每个商品都有一些特定的标签：比如下面两个例子。商品标签的重要性通过权重标出。

商品

标签

商品

标签

正品匡威帆布鞋converse all star白色/黑色/酒红拉链高帮

匡威,0.9999

开口笑,0.4291

低帮,0.3121

女鞋,0.2453

高帮,0.2186

匡威开口笑,0.1842

匡威经典款,0.1425

铆钉,0.1286

白布,0.1151

情侣,0.0997

品质保证伟乐WL--908MV头戴式舒适耳麦网吧耳机

伟乐,0.9878

头戴式,0.6898

网吧,0.5427

舒适,0.3143

pc电脑,0.0829

直插,0.0647

3.5mm,0.0572

有线,0.0494

用户在浏览时，就被打上了他刚刚看过的这些标签信息。用户对某一类商品看的越多，与那一类相关的标签就会越多。

在生成用户标签数据时，我们考虑了以下几个因素：

商品的标签权重。不重要不具有区分性的标签的权重相对较小
用户对某商品行为距离当前的时间。时间越近的影响越大，从而用户上的标签可以反应用户最近的兴趣点。
行为的类型，包括浏览、收藏、加入购物车、购买。对不同的行为类型设置不同的权重。

用户标签示例：

用户id

标签

用户id

标签

6276041xx

(一个偏好日常生活用品的用户)

毛毡:2.14

竹纤维:1.57

面巾:1.26

咖啡棒:1

沐浴瓶:1

漱口杯:1

针织:0.99

保暖:0.88

室内:0.8

生活:0.75

绑带:0.68

1058139xx

(一个偏好时尚小青年服装的用户)

林弯弯:2.59

机械表:2.03

外壳贴膜:2

个性:1.45

外壳膜:1.4

迷彩:1.4

连帽:1.28

镂空:1.16

背包:1.05

逸枫:1

iphone5:1

2、个性化排序

基于用户标签和商品标签，计算用户对商品的感兴趣程度，拍脑袋可以想出很多种方案。但是在数据化运营的时代，我们相信数据本身胜过相信拍脑袋的决策。所以我们想到了利用点击反馈数据来决定如果使用用户个性化数据。

首先，我们利用用户标签、商品标签，计算了多种相似度，作为<用户,商品>相关性的一种表达。
然后，将用户的每一次点击/无点击视为对<用户,商品>的一次反馈，形成反馈数据
最后，利用反馈数据进行机器学习训练，寻出最优的相似度组合方式

最终得到的个性化排序公式的形式是：

从用户的反馈数据中通过算法训练得出的组合规则，有以下几个优点

科学训练，保证效果，不定规则拍脑袋，节省了不断上线测试效果调整参数的工作量
自动化进行，在需要引入新的相似数据时，可以自动完成新一轮的组合规则学习

三、效果

效果对比以A/B test的方式进行，在天猫购物车-猜你喜欢，迎客松等推荐位上进行一周测试，对比测试桶和基准桶，各项指标均有显著提升。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。