推荐系统入门

最新推荐文章于 2020-11-24 20:49:14 发布

向阳争渡

最新推荐文章于 2020-11-24 20:49:14 发布

阅读量263

点赞数

分类专栏：推荐系统文章标签：推荐系统

本文链接：https://blog.csdn.net/yangyang_yangqi/article/details/79107045

版权

推荐系统专栏收录该内容

3 篇文章 1 订阅

订阅专栏

推荐算法概述：

一、基于内容属性的推荐

比较简单的推荐逻辑，单纯的依赖物品之间的属性相似来构建推荐关系。

存在问题：

对当前物品的浏览行为不能表示用户对当前物品的喜好，再对此物品推荐是个伪命题
当前主题信息已经解决了用户的问题，再推此类物品实属冗余。

基于内容的推荐风险较大，但是基于此用户主体的行为具有一定的导向作用。

二、基于用户画像的推荐

基于用户画像的推荐，更大程度上依赖于用户的画像属性来推荐，这就体现了用户偏好信息，根据偏好信息来选择候选集。
而用户画像的构建则依赖于累积的用户行为数据，通过行为数据生成用户的兴趣标签。

问题：

用户的兴趣爱好会随着时间迁移而改变，用户的实际选择还会受很多因素的影响。

三、基于协同过滤的推荐

协同过滤严格依赖用户行为及其周边用户的行为。
重点在于，如何限定周边这个范围。
比如根据两个用户的行为，去构建相关关系，从而判断两个用户的相似度。
如果以物品为维度，以用户的购买或者观看记录为向量，则可以构建物品的相似度量，判断用户的轨迹信息与当前待选物品的向量相关度，从而判断是否要推荐。

协同过滤有一定机率发现新物品。

四、冷启动问题的解决

所谓冷启动，即在推荐系统初期时，没有任何用户与物品的交集信息，即无用户的行为轨迹，无法通过类似协同或者用户偏好等方式进行推荐，这种时候，我们就称推荐系统处于冷启动状态。
此外，针对新加入的用户，或者新加入的物品，同时也是处于冷启动状态，这时需要进行特殊的处理。

马太效应

马太效应或者说长尾效应，即热者愈热，实际举例来说就是，在实际的购买场景中，由于你推荐的次数越多，部分优质的商品购买或者点击的次数就越多，形成的用户购买轨迹就越多，所以得到的推荐机会就越多，进而产生的推荐也越多，变得越热。
随着不断迭代，子子孙孙无穷尽也，这样得到推荐的商品就会集中在少部分商品中，而大部分长尾商品是沉寂的，一个推荐系统如果长时间处于长尾效应中，造成推荐疲劳，其推荐效果就会减弱。
所以，一个好的推荐系统，要考虑到适当的挖掘长尾商品，通过真的个性化，把适当的长尾商品送到真正需要他们的人手里，在实际的操作过程中，我们可以适当的进行热度降权，从而让一些中下层的商品得到更多的曝光机会，当然前提是保证点击率的情况下。
另外一个场景会形成马太效应的是热度模型，即我们的热度榜单，长时间的高居榜首，一定会获得更多的点击，而点击越多其热度越高，但我们的信息是需要保持新鲜度的，不然点击率迟早会下架的。
所以，我们使用一些机制让处于头部的商品或者信息降权，时间衰减是一个比较通用的做法，即随着时间的迁移，其整体热度会不断的下降，至于说下降的方式，速率就看模型的设计了。

AB测试

关于推荐的效果，之前我们说过其核心的考核标准就是点击率，点击的越多说明推荐的越准确，用户的停留时长也会越长，只要把用户留在平台中，机会总是会有的。其实就是一层漏斗嘛？这一层的基数越大，下一层转换的量就会越高，这也是推荐系统的核心存在意义。
并且之前也说到过，一个不好的推荐系统有时间反而会形成反向作用，所以，一个推荐系统的迭代更新至关重要。离线的效果评估一定是要做的，最起码在离线实验的阶段需要保证当前的效果优于线上效果，才能进行迭代。
但是，实际情况是复杂的，对于推荐的模型来说，离线的实验其实并没有想象中靠谱，那么，就丢到线上去真多真枪的实验一把，就知道效果了。但是，实际的生产环境中，任何一点转化波动的影响都是极其严重的，谁也不敢拿实际生产开玩笑。
于是，就有了AB测试机制的产生，所谓AB测试机制，即将流量分为AB两类，A流量走原始的旧模型，B流量走新模型，同步测试同步对比，效果一目了然。
当然，在实际的AB测试流程中，首先流量是可以自由分配的，一般情况下新模型在最终确认之前流量一定是少量的，随着模型逐渐被验证，流量比重会逐渐加大，最终确认后流量全部导向新模型，完成新模型的正式上线。
并且，通常，在实际的环境中，或许我们会同时有十多个甚至是几十个新模型在同时实验，每个模型调整的因子都不一样，最终选择最适合的因素进行调整，达到效果最优，这也就是AB测试机制的魅力所在。
所以，打造一个好的AB测试系统，首先流量是需要可控的，其次模型的迭代上线是需要高度灵活的，最后，肯定是需要有完整的数据回收、数据分析对比机制存在的。

向阳争渡

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
推荐系统入门

推荐系统入门推荐系统：推荐算法或者推荐机制并不严格等同推荐系统，推荐系统是一个相对复杂的业务系统，里头涉及到数据的处理、架构的构成、推荐的逻辑机制，反馈数据的回收、效果的跟踪、AB测试等等。很多我们耳熟能详的推荐算法，他只是解决的某种特定情况下的推荐机制问题，而整个系统很多时候是复合了多种算法结果，综合呈现的一种结果。推荐算法概述：一、基于内容属性的推荐比较简单的推荐
复制链接

扫一扫