推荐系统整理

我要学到凌晨三点半

已于 2022-03-22 19:06:07 修改

阅读量1.1k

点赞数

文章标签：推荐算法算法机器学习

于 2022-03-17 15:25:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37746859/article/details/123549150

版权

一、基本思想

① 根据用户和物品的特征，给用户推荐那些具有用户喜欢的特征的物品

② 利用用户喜欢过的物品，给用户推荐与他喜欢过的物品相似的物品

③ 利用和用户相似的其他用户，给用户推荐那些和他们兴趣爱好相似的其他用户喜欢的物品

二、推荐系统数据分析

协同过滤用到的是行为数据实际上是用户和物品相关联的数据

三、协同过滤

基于内容（Content based，CB）主要利用的是用户评价过的物品的内容特征，而CF方法还可以利用其他用户评分过的物品内容

- CF在物品不完全或难以获得时，依然可以通过其他用户的反馈给出推荐

- CF基于用户之间对于物品的评价质量，避免了CB仅依赖内容可能造成的对物品质量判断的干扰

- CF推荐不受内容限制，只要其他类似用户给出对不同物品的兴趣，CF就可以给用户推荐出内容差异很大的物品（但有某种内在联系）

CF分为两类：基于近邻和基于模型

基于近邻：

四、推荐系统评测

推荐系统实验方法：

离线实验

- 通过体制系统获得用户行为数据，并按照一定格式生成一个标准的数据集

- 将数据集按照一定的规则分成训练集和测试集

- 在训练集上训练用户兴趣模型，在测试集上进行预测

- 通过事先定义的离线指标评测算法在测试集上的预测结果

用户调查

- 用户调查需要一些真实的用户，让他们在需要测试的推荐系统上完成一些任务；我们需要记录他们的行为，并让他回答一些问题，最后进行分析

在线试验

- AB测试

把推荐系统分成两部分，根据一定规则把用户随机分成两组，推荐系统也是两套，配合分流系统，把用户导流到不同的推荐系统中，在线搜集用户的行为数据，统计不同的评测指标，来统计考查不同的两组推荐系统。

评测指标：

预测准确度用户满意度覆盖率 多样性 惊喜度 信任度实时性健壮性商业目标

推荐准确度评测

评分预测

注：T 评分的个数 rui是每个用户对每个物品的真实评分第二个是预测评分一减就是预测非误差

true positive（被正确分类的正例）

false negative（本来是正例，错分为负例）

true negative（被正确分类的负例）

false positive（本来是负例，被错分为整理）

记忆方法，前边T\F是分类正确或者错误，后面的P\N是结果被分成是正例或负例

五、数学基础

六、机器学习

1、机器怎么学习

- 处理某个特定的任务，以大量的经验为基础

- 对任务完成的好坏，给予一定的评判标准

- 通过分析经验数据，任务完成的更好了

2、机器学习定义

3、机器学习过程

海量数据 ---> 提炼规律 ---> 预测未来

4、机器学习主要分类

有监督学习：提供数据并提供数据对应结果的机器学习过程

无监督学习：提供数据并且不提供数据对应结果的机器学习过程

强化学习：通过与环境交互并获取延迟返回进而改进行为的学习过程

5、监督学习三要素：

模型：总结数据的内在规律，用数学函数描述的系统

策略：选取最有模型的评价准则

算法：选取最优模型的具体方法

6、模型评估策略

模型评估：

- 训练集和测试集

（训练集：输入到模型中对模型进行训练的数据集合，用来测试模型好坏的集合）

（测试集：模型训练完成后对测试训练效果的数据集合）

- 损失函数和经验风险

- 训练误差和测试误差

模型选择

- 过拟合和欠拟合

- 正则化和交叉验证

注：梯度下降不一定能够找到全局的最优解，有可能是一个局部最优解，如果损失函数是凸函数，梯度下降算法得到的解就一定是全局最优解

监督学习->回归模型

线性回归模型：

一元线性回归

多元线性回归

非线性回归模型

最小二乘法

作为模型评估策略

实际应用多元线性回归

如果有两个或两个以上的自变量，这样的线性回归分析就称为多元线性回归

分类模型：k近邻逻辑斯谛回归决策树

希望的损失函数

我要学到凌晨三点半

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。