要求采用Spark MLlib完成一个电影推荐程序
根据用户以往的电影评价数据,构建推荐模型,进而对编号为i的用户推荐不少于3部电影,推荐列表中给出电影的编号和预测打分,要求采用HDFS存储输入文件,即给出用户的id列表;输出文件位置也为HDFS 文件系统下的目录,输出文件中每行记录分别包括用户id、推荐列表,如下所示。。。。。。。。。。。。。。。。。。:利用sbt,或者maven,或者集成开发环境开发后,能够打包成jar包。要求上传数据集文件到HDFS上存储;要求能够撰写shell脚本执行spark程序。过程需要截图。:程序要支持分布式集群运行。
原创
2023-03-31 15:22:37 ·
292 阅读 ·
0 评论