spark实现 通过ratings.dat和movies.dat两个文件得到平均得分超过4.0的电影列表
两个测试集下载地址:http://grouplens.org/datasets/movielens 记住: 采用的数据集是ml-1m,自己在上面链接里面找数据集示例:ratings.dat:(id,电影id,评分,时间戳)用::符号分割1::1193::5::978300760
1::661::3::978302109
1::914::3::978301968
1::3408::4::978300...
原创
2018-06-08 15:28:47 ·
5045 阅读 ·
4 评论