推荐系统综述

最新推荐文章于 2022-03-04 21:27:35 发布

yichudu

最新推荐文章于 2022-03-04 21:27:35 发布

阅读量7.8k

点赞数 5

分类专栏：推荐系统

天天开心

本文链接：https://blog.csdn.net/chuchus/article/details/79127672

版权

推荐系统专栏收录该内容

28 篇文章

订阅专栏

1.简述

推荐系统用处很大, 遍地开花, 什么都可以推荐, 如抖音推荐视频, 百度推荐广告, 淘宝推荐商品, 咨询应用推荐文章等等. 用了推荐系统, 用户点击变多了, 商家也赚得多了, 何乐不为呢?
本文就以商品推荐为例, 把各种做法和实现原理做个综述.

一般讲推荐的文章, 只提思想, 略过了工程实现, 而要工程落地的话, 就必须思考 数据结构怎么设计, 哪些数据是线下准备的, 哪些数据是线上计算的, 推荐系统各模块之间的耦合和联系又是怎样的 等问题.
笔者作为一个热心肠的人, 就把业界的惯用做法放出来, 让大家过一下瘾.

推荐的本质很简单: 给一个足够大的候选池, 挑出用户在没有明确意图下的最感兴趣的优质东西. 所以要做的事情有两块:

计算商品与用户兴趣的相关度.
用户希望看到优质热门商品, 所以要结合商品的质量分综合排序.

推荐系统大致的处理流程我画了出来:

这里写图片描述
figure 1 推荐系统的数据流转

2.分阶段讨论

对于图1的流程, 我们分阶段讨论.

离线数据准备

协同数据

基本思想：在购买了item_1物品的用户集合中，很多也买了item_2，那么其他item_1的购买者也是item_2的潜在购买者。

在此基本思想上, 还可以运用很多改进算法. 所以我们可以讲协同是一类算法的统称. 它们的输入输出是这样的:
input : < user_id, click_item_list>
output: < item_id, proximate_item_list>
更多讨论见我的另一篇文章 <<推荐系统中的match阶段>> , 见参考 [1].

特征数据

需要事先建立起衔接用户偏好与商品特征的特征维度. 如卖家, 一级类目, 叶子类目等.

对用户
为了更好的区分不同的偏好维度, 可以用到Trigger这种数据结构.

class Trigger{
	long triggerType;	// 主键, 便于UserTrigger 与 ItemTrigger 通过主键当外键使用.
	long triggerId; //如 偏爱类目id
	double score; //此trigger的重要程度. 比如 商品协同 要比 类目匹配 优先考虑.
}

借助于trigger体系, 通常用数据结构UserTrigger表示用户特征.

class UserTrigger{
	long userId; //用户id
	Trigger trigger;
	double score;		// 偏爱程度, 可以用 [0,1] 正规化
}

把这些记录放在表User2ItemTrigger中的话, 联合主键为userId,triggerType,triggerId.
这里的Item 并不是商品, 而是是泛指品牌, 类目这种.

对商品
商品的特征包括两部分: 品牌,类目等固有属性是后台上架时本身就有的; 适用人群等信息还是上架一段时间后基于统计得到的.
在建立商品的i2i召回数据时, 也可以用下面的数据结构.

class ItemTrigger{
	long itemId; //商品id
	Trigger trigger;
	double score;		// 联系紧密程度, 可以用 [0,1] 正规化
}

像购买能力这种关键特征, 存储的详细一点比较好. 比如购买能力不能只按价格区分, 因为不同的东西价格档位就不一样(如手机普遍千元以上, 但台灯在百元左右). 同一个用户, 在不同类目下的消费风格也不一样(如手机买个普通能用的就行, 但衣服都要买上千块的名牌), 也要区分存储.
类似于User2ItemTrigger, 我们也建立了 Item2ItemTrigger 表.联合主键为itemId,triggerType,triggerId.
第一个Item 是泛指品牌, 类目这种, 第二个才是商品.

itemTrigger2item数据表准备

为了保证召回结果的多样性, 准备这部分数据时也会进行截断,比如一级类目, 同一个一级类目下可能有上万个商品, 一般按个数= $50$ 截断.
那么问题可以抽象为 <trigger,{item}> 二元组中, item集合过大, 舍弃谁留下谁, 怎么做决策呢?
可以考虑这个公式:
$bandit\_ctr = \begin{cases} \frac{click} n, & pv < n \\ \frac{click}{pv}- \frac 1 n, & \text{otherwise} \end{cases}$

这个公式有三方面的考虑:

当曝光不充分时, ctr是不稳定的, 所以不用pv作分母.
当内容的ctr低于 $\frac 1 n$ 时, 会变为负数, 被淘汰掉.
其他情况下, ctr高的就会被优先召回.

trigger是链接userTrigger与itemTrigger的桥梁.

在线召回

上面提到的信息是可以一次准备多次复用的, 并且量是很大的, 像 i2i 的召回表Item2ItemTrigger可以多达几百亿行数据. 所以一般离线算好.
在线系统做了哪些事情呢? 是以下三件.

userTrigger 查询

收到客户端请求后, 根据userId, 查出该user下的若干个 userTrigger.

itemTrigger 召回

通过上一步userTrigger中的trigger, 来找到itemTrigger. 通过此步查询, 我们得到了若干个商品 (比如说2000个).

注意事项

需要注意的是userTrigger间的优先级和召回结果的丰富度.

优先级
同一user的 userTrigger 有很多, 可以区分优先级, 优先召回重要的. 比如用户在A类目下点了一个商品, 而在B类目下点了很多商品, 那么有关B的userTrigger优先级更高
丰富度
我们希望召回的itemTrigger中trigger也尽量丰富, 所以可以控制一下各trigger的占比.
得分计算
足够精细的话, 也可以算一下得分.
$\tag 1$ , 就是userId与itemId的匹配得分啦.

过滤最近已看

近段时间推荐系统已经给用户甲推荐过商品A, 甲点进去看了, 那么此时就不需要再重复推荐这个A商品了.

模型排序

详见参考[2].

简述中我们提到了, 如果召回商品过多, 并且很多商品的相关度得分相同, 就必须要进行合理的排序. 因为用户不可能把相关的上万个商品都浏览一遍, 他们通常只会关注排在前几页的商品.
排序中也要关注推荐商品的质量, 虽然一个商品在兴趣方面挺吻合, 但差评很多或者销量很差, 也会把它排在后面.

推荐系统使用一段时间后, 就可以通过真实的用户点击行为来训练排序模型啦.
常用的是逻辑回归 LR 等. 不少做推荐的会吹嘘用到的特征是千万级别乃至上亿, 人们听到就会觉得好厉害啊. 其实不然. 他们只是把具有枚举值的特征给展开了而已. 商品id, 卖家id, 这些本身就是上亿级别的量. 对于这种稀疏的特征, LR 还可以处理, 换做决策树/GBDT 等, 就歇菜了.

多目标

推荐系统的排序是有依据的. 我们的目标不同时, 推荐结果也会随之不同.
比如我们期望通过该推荐系统提升销量, 排序时就会着重考虑商品的火爆程度; 期望的是成交额, 就会着重考虑商品价格.
当然了, 也可以各个因素综合考虑, 结合ctr共同决定排序结果.

展示打散

为了避免推荐结果中高度相似的商品扎堆出现, 需要把它们打散, 类似洗牌一样.
按照类目打散是个不错的主意.

这里写图片描述
figure 商品类目层级举例

于是, 我们就可以按照类目维度对其进行打散.
这一步做的再精细一点, 就是按triggerName,triggerId为依据进行打散了.

2.5 bandit 探索

推荐的商品是与用户浏览行为相关的, 而用户能看到的商品又是与系统推荐相关的, 长此以往, 推荐结果越来越狭隘, 我们需要帮助用户发现一些新的东西, 拓展兴趣.
详见 bandit, 多臂赌博机中的探索-利用模型

3. 推荐效果评价

3.1 投放前评价

准确率召回率
太常用了, 此处略过, 但跟普通的分类问题不一样, 召回结果那么多, 人工标也不合理, 难以实施.
nDCG
可以参考我的博文, nDCG 排序模型评价指标

3.2 投放后效果评价

系统投入使用以后, 就会拿到各种真实数据, 看看 ctr 什么的满不满足预期. ctr 又可以分为pvctr ( $\frac {推荐结果点击数}{推荐结果曝光数}$ )和 uvctr( $\frac {推荐结果点击人数}{推荐结果曝光人数}$ ).
也可以AB测试, 通过实验验证心中的各种方案.