推荐算法分类综述

最新推荐文章于 2024-10-10 17:56:16 发布

imarklei

最新推荐文章于 2024-10-10 17:56:16 发布

阅读量5.3k

点赞数

分类专栏：推荐算法文章标签：算法推荐系统

推荐算法专栏收录该内容

1 篇文章 1 订阅

订阅专栏

推荐算法分类综述

推荐系统在各种系统中广泛使用，推荐算法则是其中最核心的技术点，InfoQ接下来将会策划系列文章来为读者深入介绍。推荐算法综述分文五个部分，本文作为第一篇，将会简要介绍推荐系统算法的主要种类。其中包括算法的简要描述、典型的输入、不同的细分类型以及其优点和缺点。在第二和第三篇中，我们将会详细介绍这些算法的区别，让你能够深入理解他们的工作原理。

注：本文翻译自Building Recommenders，InfoQ中文站在获得作者授权的基础上对文章进行了翻译。

为推荐系统选择正确的推荐算法是非常重要的决定。目前为止，已经有许多推荐算法可供选择，但为你需要解决的特定问题选择一种特定的算法仍然很困难。每一种推荐算法都有其优点和缺点，当然也有其限制条件，在作出决定之前，你必须要一一考量。在实践中，你可能会测试几种算法，以发现哪一种最适合你的用户，测试中你也会直观地发现它们是什么以及它们的工作原理。

推荐系统算法通常是某类推荐模型的实现，它负责获取数据，例如用户的喜好和可推荐项的描述，以及预测给定的用户组会对哪些选项感兴趣。

推荐算法通常被分为四大类（1-4）：

协同过滤推荐算法
基于内容的推荐算法
混合推荐算法
流行度推荐算法

除了这些种类以外，还有一些高级非传统的推荐算法（5）。

推荐算法综述是分文五个部分的系列文章，本文作为第一篇，将会简要介绍推荐系统算法的主要种类。其中包括算法的简要描述、典型的输入、不同的细分类型以及其优点和缺点。在第二和第三篇中，我们将会详细介绍这些算法的区别，让你能够深入理解他们的工作原理。系列文章中的一些内容参考了一篇来自 RecSys 2014 tutorial 的文章：由Xavier Amatriain编写的The Recommender Problem Revisited。

1.协同过滤推荐算法

简介：通过在用户的一系列行为中寻找特定模式来产生用户特殊推荐
输入：仅仅依赖于惯用数据（例如评价、购买、下载等用户偏好行为）
类型：
- 基于邻域的协同过滤（基于用户和基于项）
- 基于模型的协同过滤（矩阵因子分解、受限玻尔兹曼机、贝叶斯网络等等）
优点：
- 需要最小域
- 不需要用户和项
- 大部分场景中能够产生足够好的结果
缺点：
- 冷启动问题
- 需要标准化产品
- 需要很高的用户和项的比例（1：10）
- 流行度偏见（有长尾的时候表现不够好）
- 难于提供解释

2.基于内容的推荐算法

简介：向用户推荐和其过去喜欢项的内容（例如元数据、描述、话题等等）相似的项
输入：仅仅依赖于项和用户的内容/描述（除了惯用数据）
类型：
- 信息检索（例如 tf-idf 和 Okapi BM25）
- 机器学习（例如朴素贝叶斯、支持向量机、决策树等等）
优点：
- 没有冷启动问题
- 不需要惯用数据
- 没有流行度偏见，可以推荐有罕见特性的项
- 可以使用用户内容特性来提供解释
缺点：
- 项内容必须是机器可读的和有意义的
- 容易归档用户
- 很难有意外，缺少多样性
- 很难联合多个项的特性

3.混合推荐算法

简介：综合利用协同过滤推荐算法和基于内容的推荐算法各自的优点同时抵消各自的缺点
输入：同时使用用户和项的内容特性与惯用数据，同时从两种输入类型中获益
类型：
- 加权
- 交换
- 混合
- 特性组合
- 案列
- 特征增强
- 元层次
优点：
- 由于单独使用协同过滤推荐算法和基于内容的推荐算法
- 没有冷启动问题
- 没有流行度偏见，可推荐有罕见特性的项
- 可产生意外，实现多样性
缺点：
- 需要通过大量的工作才能得到正确的平衡

4.流行度推荐算法

简介：这是一种推荐流行项的方法(例如最多下载、最多看过、最大影响的项)
输入：使用惯用数据和项的内容（例如类目）
优点：
- 相对容易实现
- 良好的基准算法
- 有助于解决新用户冷启动问题
缺点：
- 需要标准化产品
- 经常需要一些项的类型进行分类
- 不会推荐新项（很少有机会被观测到）
- 推荐列表不会改变太大

5.高级非传统推荐算法

类型：
- 深度学习
- 学习等级
- Multi-armed bandits（探索/开发）
- 上下文感知推荐
- 张量分解
- 分解机
- 社会推荐
优点：
- 利于勉强维持最终性能百分点
- 你可以说你正在使用渐进的方式
缺点：
- 难于理解
- 缺乏推荐工具支持
- 没有为你的首个推荐系统提供推荐的方式

关注

0
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

imarklei CSDN认证博客专家 CSDN认证企业博客

码龄9年

39: 原创

18万+: 周排名

48万+: 总排名

14万+: 访问

: 等级

1602: 积分

79: 粉丝

53: 获赞

26: 评论

91: 收藏

私信

关注

热门文章

分类专栏

最新评论

5类系统推荐算法
Champhoenix: 不错
Python之Requests模块使用详解
原来你是小幸运: 感谢，重定向问题困扰过我，现在解决了
Python之Requests模块使用详解
Chuxuezhe_Kang: [code=python] [/code]import requests import csv import os import re #proxies = {"http": "http://182.139.91.185"} requests.packages.urllib3.disable_warnings() requests.adapters.DEFAULT_RETRIES = 5 root = 'D:/mypython/IMDb-Face003' annotation_path = root + '/annotation.txt' log_file_path = root + '/log.txt' flog = open(log_file_path, 'r+') with open ('D:/mypython/IMDb03-Face.csv','r',encoding='gb18030') as csvfile: reader = csv.reader(csvfile) annotation = open(annotation_path, 'a+') count = -1 break_point = flog.read() print(break_point) if break_point != '': count = int(break_point) i = -1 for row in reader: if i <= count: i = i + 1 continue name = row[0] bbox = row[3] url = row[5] print(url) imgresponse = requests.get(url,timeout=35) image = imgresponse.content try: subdir = root + '/' + name if not os.path.exists(subdir):
全栈工程师笔记/记一个完整的项目流程
wang0112233: 顶~~
5类系统推荐算法
hhhhyyyyy123: 博主好人！有俩点问题想请教一下，一个是，你贴出来的用户相似度的图，感觉好像是Item相似度的。二是能不能详细说一下基于item的CF，为什么要用关联矩阵，关联矩阵相乘后的结果表示什么，你可以详细的说明一下吗？多谢了！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。