基于spark的图书推荐系统基于大数据的图书推荐基于模型的协同过滤图书推荐系统矩阵分解 ALS推荐

最新推荐文章于 2024-05-08 09:35:11 发布

「已注销」

最新推荐文章于 2024-05-08 09:35:11 发布

阅读量833

点赞数

文章标签：大数据 spark 分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_77272393/article/details/129789256

版权

基于spark的图书推荐系统基于大数据的图书推荐基于模型的协同过滤图书推荐系统矩阵分解 ALS推荐（最小二乘法）
数据源：BookCrossing (BX) 数据集由 Cai-Nicolas Ziegler 在 Humankind Systems 首席技术官 Ron Hornbaker 的善意许可下从 Book-Crossing 社区进行为期 4 周的爬行（2004 年 8 月 9 月）收集。
它包含 278,858 名用户（匿名但具有人口统计信息），对 271,379 本书提供 1,149,780 个评分（显式隐式）。
推荐流程：
（1）数据清洗：过滤重复的数据，比如同个书编的书籍信息，评分为0分的不合理信息，将清洗后的数据保存到mysql数据库中
（2）模型训练：从mysql数据库中读取评分数据，通过spark构建模型后填充数据进行模型训练，模型训练后可以保存模型到本地，当有新数据时再重新训练，这个过程可以用采用本地启动spark进行运算也可以将任务提交到spark集群上运算（前提时已搭建好spark集群）
（3）数据推荐：为每个用户推荐20本书，并将推荐结果保存到数据库中
（4）通过springboot搭建一个图书借阅系统展示数据，当新用户在平台借书后归还图书则会增加数据集，触发计算则会有新的推荐结果。

ID:81480692261157726

请添加图片描述

「已注销」

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
基于spark的图书推荐系统基于大数据的图书推荐基于模型的协同过滤图书推荐系统矩阵分解 ALS推荐

（2）模型训练：从mysql数据库中读取评分数据，通过spark构建模型后填充数据进行模型训练，模型训练后可以保存模型到本地，当有新数据时再重新训练，这个过程可以用采用本地启动spark进行运算也可以将任务提交到spark集群上运算（前提时已搭建好spark集群）基于spark的图书推荐系统基于大数据的图书推荐基于模型的协同过滤图书推荐系统矩阵分解 ALS推荐（最小二乘法）（1）数据清洗：过滤重复的数据，比如同个书编的书籍信息，评分为0分的不合理信息，将清洗后的数据保存到mysql数据库中。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。