算法面试必备-----推荐算法

最新推荐文章于 2024-07-11 09:05:36 发布

Avery123123

最新推荐文章于 2024-07-11 09:05:36 发布

阅读量2.7k

点赞数 4

分类专栏：算法岗面试笔试准备

本文链接：https://blog.csdn.net/avery123123/article/details/107375099

版权

算法面试必备-----推荐算法

算法面试必备-----推荐算法

算法面试必备-----推荐算法

推荐算法概述

1、基于流行度的推荐算法

比较简单粗暴，主要是对热点商品或者信息推荐。它主要是根据PV、UV、日均PV或分享率等数据来按某种热度排序来推荐给用户。

优点是简单，适用于刚注册的新用户，能够解决对新用户进行推荐的冷启动问题。

缺点也很明显，它无法针对用户提供个性化的推荐。基于这种算法也可做一些优化，比如加入用户分群的流行度排序，例如把热榜上的体育内容优先推荐给体育迷，把政要热文推给热爱谈论政治的用户。

2、基于内容的推荐算法

是在推荐引擎出现之初应用最为广泛的推荐机制，它的核心思想是根据推荐物品或内容的元数据，发现物品或者内容的相关性，然后基于用户以往的喜好记录，推荐给用户相似的物品。这种推荐系统多用于一些资讯类的应用上，针对文章本身抽取一些tag作为该文章的关键词，继而可以通过这些tag来评价两篇文章的相似度。

优点在于：

易于实现，不需要用户数据因此不存在稀疏性和冷启动问题。
基于物品本身特征推荐，因此不存在过度推荐热门的问题。

缺点在于：
抽取的特征既要保证准确性又要具有一定的实际意义，否则很难保证推荐结果的相关性。豆瓣网采用人工维护tag的策略，依靠用户去维护内容的tag的准确性。

3、基于关联规则的推荐算法

更常见于电子商务系统中，并且也被证明行之有效。其实际的意义为购买了一些物品的用户更倾向于购买另一些物品。基于关联规则的推荐系统的首要目标是挖掘出关联规则，也就是那些同时被很多用户购买的物品集合，这些集合内的物品可以相互进行推荐。目前关联规则挖掘算法主要从Apriori和FP-Growth两个算法发展演变而来。

基于关联规则的推荐系统一般转化率较高，因为当用户已经购买了频繁集合中的若干项目后，购买该频繁集合中其他项目的可能性更高。

该机制的缺点如下：

计算量较大，但是可以离线计算，因此影响不大。
由于采用用户数据，不可避免的存在冷启动和稀疏性问题。
存在热门项目容易被过度推荐的问题。

4、基于协同过滤的推荐算法

协同过滤是一种在推荐系统中广泛采用的推荐方法。这种算法基于一个“物以类聚，人以群分”的假设，喜欢相同物品的用户更有可能具有相同的兴趣。基于协同过滤的推荐系统一般应用于有用户评分的系统之中，通过分数去刻画用户对于物品的喜好。协同过滤被视为利用集体智慧的典范，不需要对项目进行特殊处理，而是通过用户建立物品与物品之间的联系。

目前，协同过滤推荐系统被分化为两种类型：基于用户(User-based)的推荐和基于物品(Item-based)的推荐。

4.1、基于用户的推荐

基于用户的协同过滤推荐的基本原理是，根据所有用户对物品或者信息偏好（评分），发现与当前用户口味和偏好相似的“邻居”用户群，在一般应用中是采用计算K近邻的算法；基于这 K个邻居的历史偏好信息，为当前用户进行推荐。

优点：
在于推荐物品之间在内容上可能完全不相关，因此可以发现用户的潜在兴趣，并且针对每个用户生成其个性化的推荐结果。

缺点：
在于一般的Web系统中，用户的增长速度都远远大于物品的增长速度，因此其计算量的增长巨大，系统性能容易成为瓶颈。因此在业界中单纯的使用基于用户的协同过滤系统较少。
在这里插入图片描述

4.2、基于物品的推荐

基于物品的协同过滤和基于用户的协同过滤相似，它使用所有用户对物品或者信息的偏好（评分），发现物品和物品之间的相似度，然后根据用户的历史偏好信息，将类似的物品推荐给用户。基于物品的协同过滤可以看作是关联规则推荐的一种退化，但由于协同过滤更多考虑了用户的实际评分，并且只是计算相似度而非寻找频繁集，因此可以认为基于物品的协同过滤准确率较高并且覆盖率更高。

优点：
同基于用户的推荐相比，基于物品的推荐应用更为广泛，扩展性和算法性能更好。由于项目的增长速度一般较为平缓，因此性能变化不大。

缺点：
无法提供个性化的推荐结果。

在这里插入图片描述

协同过滤算法总结

两种协同过滤：基于用户和基于物品两个策略中应该如何选择呢？其实基于物品的协同过滤推荐机制是Amazon 在基于用户的机制上改良的一种策略，因为在大部分的Web 站点中，物品的个数是远远小于用户的数量的，而且物品的个数和相似度相对比较稳定；同时基于物品的机制比基于用户的实时性更好。但也不是所有的场景都是这样的情况，在一些新闻推荐系统中，也许物品，也就是新闻的个数可能大于用户的个数，而且新闻的更新程度也有很快，所以它的相似度依然不稳定。所以，推荐策略的选择其实也和具体的应用场景有很大的关系。

基于协同过滤的推荐机制是现今应用最为广泛的推荐机制，它有以下几个显著的优点：

1.它不需要对物品或者用户进行严格的建模，而且不要求物品的描述是机器可以理解的，所以这种方法也是领域无关的。

2.这种方法计算出来的推荐是开放的，可以共用他人的经验，很好的支持用户发现潜在的兴趣偏好。

然后而它也存在以下几个问题：

1.方法的核心是基于历史数据，所以对新物品和新用户都有“冷启动”的问题。

2.推荐的效果依赖于用户历史偏好数据的多少和准确性。

3.在大部分的实现中，用户历史偏好是用稀疏矩阵进行存储的，而稀疏矩阵上的计算有些明显的问题，包括可能少部分人的错误偏好会对推荐的准确度有很大的影响等等。

4.对于一些特殊品味的用户不能给予很好的推荐。

5.由于以历史数据为基础，抓取和建模用户的偏好后，很难修改或者根据用户的使用演变，从而导致这个方法不够灵活。

5、基于模型的推荐算法

基于模型的方法有很多，主要是使用常用的机器学习算法对目标用户简历推荐算法模型，然后对用户的爱好进行预测推荐以及对推荐的结果打分排序等。

基于模型的算法特点十分明显：快速、准确。因此它比较适用于实时性比较高的业务如新闻、

最低0.47元/天解锁文章

Avery123123

关注

4
点赞
踩
32

收藏

觉得还不错? 一键收藏
1
评论
算法面试必备-----推荐算法

算法面试必备-----推荐算法算法面试必备-----推荐算法推荐算法概述1、基于流行度的推荐算法2、基于内容的推荐算法3、基于关联规则的推荐算法4、基于协同过滤的推荐算法4.1、基于用户的推荐4.2、基于物品的推荐协同过滤算法总结5、基于模型的推荐算法6、混合算法推荐算法详解关联规则：基础概念关联规则：Apriori算法算法过程算法的不足关联规则：FP-growth算法算法概述算法流程协同过滤（CF）算法概述基于用户的协同过滤算法（User-Based CF）基本步骤一、寻找用户间的相似度二、推荐物品三、
复制链接

扫一扫

专栏目录