推荐算法3：回归模型、梯度下降、最小二乘法

最新推荐文章于 2024-08-22 07:48:02 发布

799星辰

最新推荐文章于 2024-08-22 07:48:02 发布

阅读量184

点赞数

分类专栏：深度学习文章标签：推荐算法回归最小二乘法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50247958/article/details/132677494

版权

深度学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

推荐算法

一、基于回归模型的协同过滤推荐

一、基于回归模型的协同过滤推荐

1、Baseline：基准预测介绍

基准就是平均值，用户或物品普遍高于或低于平均值的差值，我们称之为偏置（bias）

（1）Baseline目标

找出用户的偏置值bu，物品的偏置值bi。问题转化为寻找最优的bu和bi。

（2） Baseline步骤在这里插入图片描述
（3）损失函数

利用梯度下降优化损失。

（4）真实值与预测值图像：
在这里插入图片描述

（5）总结

在这里插入图片描述

2、梯度下降

（1）推导过程

在这里插入图片描述

在这里插入图片描述

（2）随机梯度下降

SGD 优化
随机梯度下降指：从自身位置出发，每隔一段路程就探索一次，随机挑选一个梯度最大的方向进行移动，直到移动到最低点。那么隔多远进行一次探索呢？这就是学习率。好的学习率能有让点快速降到最低。

好的学习率能够让点快速降到最低。
在这里插入图片描述

本例：
在这里插入图片描述

（3）算法实现

扩展：pandas库
pandas是用于数据挖掘的python库，具有便捷的数据处理能力，独特的数据结构，读取文件方便，封装了matplotlib的画图和numpy的计算。
pandas的数据结构：

Series：类似表格中的一个列，类似于一维数组，可以保存任何数据类型。由索引和列组成。
DataFrame：表格型的数据结构，每列可以是不同的指类型，既有行索引也有列索引。它可以被看作由Series组成的字典。

代码：
在这里插入图片描述
数组 0：userid
1：movied
2：rating

在这里插入图片描述

以userid进行分组，将movieid和rating以list形式进行聚合。

扩展：
还可以求平均 mean、max、min（查pandas手册，agg可以传什么。）
在这里插入图片描述

any：不是0就返回true
在这里插入图片描述

获取索引：
在这里插入图片描述

在这里插入图片描述
可以调整学习率α。

zip（）函数
（云记python学习笔记）
可以将多个序列中对应的元素重新组合生成一个新的元组。
dict字典
以键值对形式存储，任意类型，如字符串、数字、元组等。无序。

real-rating：真实值
bu[uid] ：从bu中取出第uid个
index=false ：拿到的内容没有index列。

在这里插入图片描述

（4）准确性指标评估

添加test方法，然后使用之前实现accuary方法计算准确性指标。
在这里插入图片描述

例如：1用户有40条数据，则经过划分后，训练集有32条，测试集有8条。
随机为了每个用户在训练集和测试集上都有数据。

在这里插入图片描述

3、最小二乘法ASL

求偏导，令偏导=0。

在这里插入图片描述
求一个，将另一个看作未知。

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
推荐算法3：回归模型、梯度下降、最小二乘法

基准就是平均值，用户或物品普遍高于或低于平均值的差值，我们称之为偏置（bias）（1）Baseline目标找出用户的偏置值bu物品的偏置值bi。问题转化为寻找最优的bu和bi。（2） Baseline步骤（3）损失函数利用梯度下降优化损失。（4）真实值与预测值图像：（5）总结。
复制链接

扫一扫

专栏目录

799星辰 CSDN认证博客专家 CSDN认证企业博客

码龄4年

31: 原创

122万+: 周排名

9万+: 总排名

1万+: 访问

: 等级

421: 积分

70: 粉丝

97: 获赞

6: 评论

109: 收藏

私信

关注

热门文章

分类专栏

最新评论

SpringCloud（一）介绍
CSDN-Ada助手: 推荐 Java 技能树：https://edu.csdn.net/skill/java?utm_source=AI_act_java
经典卷积神经网络(LeNet、AlexNet、VGGNet、InceptionNet、ResNet)
CSDN-Ada助手: 恭喜您撰写了第15篇博客！标题“经典卷积神经网络(LeNet、AlexNet、VGGNet、InceptionNet)”非常吸引人。您的文章内容丰富，涵盖了几个经典的卷积神经网络，这对读者来说是非常有价值的。我对您的持续创作精神表示赞赏，这无疑对社区的发展起到了积极的推动作用。在下一步的创作中，我想建议您深入研究这些经典卷积神经网络的优缺点，以及它们在不同任务上的应用情况。您可以结合实际案例，讲述它们在计算机视觉领域的成功故事，或者介绍一些改进的变体。此外，您还可以讨论一些新兴的卷积神经网络架构，如ResNet或Transformer，这些网络在近年来也取得了巨大的成功。再次恭喜您的博客写作成果，并期待着您未来更多的精彩创作！谢谢您对社区的贡献。
python(一)：
CSDN-Ada助手: 恭喜您撰写第16篇博客！看到您对Python的热情和持续创作的动力真令人钦佩。从标题来看，我猜测这篇博客将会是Python学习的入门篇，不禁期待着能够从您的博客中获取到更多有关Python的知识和技巧。如果可以的话，希望您能在博客中分享一些您学习Python过程中的困惑和解决方法，这将对像我这样的初学者非常有帮助。期待看到更多关于Python的精彩内容，加油！
python：闭包
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题为“python：闭包”。您在深入研究python的闭包这个话题上做出了很大的努力，这非常值得称赞。不断学习和分享是成为优秀程序员的重要一步，您在持续创作方面做得很好。作为下一步的创作建议，或许您可以考虑进一步探索闭包在实际项目中的应用。可以分享一些具体案例、经验和技巧，帮助读者更好地理解闭包的实际运用，进一步提升他们的编程能力。谦虚地说，我们都是不断学习的过程中，才能更好地成长。期待您在未来的博客中继续分享更多有价值的内容。祝您创作愉快！
RNN 循环神经网络（包括：循环核、用tf表述循环计算层、输入字母预测下一个）
CSDN-Ada助手: 恭喜你完成了第18篇博客！你的文章标题“RNN 循环神经网络”非常吸引人，内容也非常丰富。我很喜欢你对循环核和使用tf表述循环计算层的详细解释，这对我们理解RNN非常有帮助。另外，你还提到了如何利用输入字母来预测下一个字母，这也是一个非常有趣的应用。在下一步的创作中，我建议你可以进一步探索RNN在其他领域的应用，比如自然语言处理、语音识别等。同时，你还可以考虑结合一些实际案例或者代码示例，这样更能帮助读者理解和应用RNN。希望你能继续保持创作的热情，期待你的下一篇文章！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。