基于Spark-ALS的协同过滤算法推荐系统

最新推荐文章于 2023-07-06 16:12:27 发布

VIP文章 Fantastic_Liar

最新推荐文章于 2023-07-06 16:12:27 发布

阅读量1.6k

点赞数

分类专栏：数据科学文章标签： Spark 简易推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fantastic_liar/article/details/82050546

版权

最简单的推荐系统，起到抛砖引玉的作用，各位看官见谅！使用的是MovieLens里面的ml-100k的范例数据集。

path="hdfs://localhost:9000/user/fantastic_liar/"
rawUserData=sc.textFile(path+"data/u.data")
rawUserData.count()

# 用户id，项目id，评价，日期时间
rawUserData.first()

'196\t242\t3\t881250949'

#导入Rating模块
from pyspark.mllib.recommendation import Rating
rawRatings=rawUserData.map(lambda line:line.split("\t")[:3])
rawRatings.take(5)

[['196', '242', '3'],
 ['186', '302', '3'],
 ['22', '377', '1'],
 ['244', '51', '2'],
 ['166', '346', '1']]

#ALS训练数据格式是RatingRDD数据类型，Rating定义如下（Ratin

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
基于Spark-ALS的协同过滤算法推荐系统

最简单的推荐系统，起到抛砖引玉的作用，各位看官见谅！使用的是MovieLens里面的ml-100k的范例数据集。path="hdfs://localhost:9000/user/fantastic_liar/"rawUserData=sc.textFile(path+"data/u.data")rawUserData.count()100000# 用户id，项目id，评价，日期时...
复制链接

扫一扫

专栏目录

Fantastic_Liar CSDN认证博客专家 CSDN认证企业博客

码龄6年

17: 原创

14万+: 周排名

140万+: 总排名

6万+: 访问

: 等级

697: 积分

26: 粉丝

20: 获赞

15: 评论

156: 收藏

私信

关注

热门文章

分类专栏

容器
spark 1篇
测试 1篇
数据科学 4篇
Spring 1篇
sql 4篇
爬虫 1篇
面试总结 3篇
无线定位技术概述
问题 1篇
工具 1篇
hive 3篇
Linux 1篇

最新评论

Hive中利用正则表达式过滤列名
amountainman: "?+.+"这一串数量限定符到底是什么意思啊？
用户留存模型
向彪-blockchain: 写的很详细，学习到很多，感谢大佬！
批量转换word为pdf
etoa: 感谢分享。不过这种方法是调用office，太慢。
批量转换word为pdf
spinstein: C:\Users\******\Desktop\1>python words2pdfs.py Traceback (most recent call last): File "words2pdfs.py", line 2, in <module> from win32com import client ModuleNotFoundError: No module named 'win32com'
记录pyspark中的sortBykey和sortBy的问题
Fantastic_Liar 回复 alanxiecsdn: 你是正确的，sortByKey里的切片仅限于key值。在你的例子中，我尝试将x[1]改为x[2]时，报错string index out of range，这是因为“14”的index超出list范围。感谢你的帮助！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。