spark算法推荐系统实例

最新推荐文章于 2022-06-13 00:10:50 发布

波点兔

最新推荐文章于 2022-06-13 00:10:50 发布

阅读量565

点赞数 7

分类专栏：大数据

本文链接：https://blog.csdn.net/qq_42437577/article/details/102549975

版权

大数据专栏收录该内容

10 篇文章 1 订阅

订阅专栏

首先，上传u.data和u.item至/home/data文件夹下，并启动spark(spark-shell)。
1、导入数据并查看

val rawUserData=sc.textFile("file:/home/data/u.data")

在这里插入图片描述
2、查看前五条信息，以及userid，itemid，评分信息

textFile.take(5).foreach(println)
rawUserData.map(_.split("\t")(1).toDouble).stats()//查看userid信息
rawUserData.map(_.split("\t")(0).toDouble).stats()//查看itemid信息
rawUserData.map(_.split("\t")(2).toDouble).stats()//查看评分信息

在这里插入图片描述
3、导入ALS和Rating链接库

import org.apache.spark.mllib.recommendation.ALS
import org.apache.spark.mllib.recommendation.Rating

在这里插入图片描述
4、读取rawUserData的前三个字段

val rawRatings=rawUserData.map(_.split("\t").take(3) )

在这里插入图片描述
5、准备ALS训练数据

val ratingsRDD=rawRatings.map{case Array(user,movie,rating)=>Rating(user.toInt,movie.toInt,rating.toDouble)}

在这里插入图片描述
6、使用ALS.train命令进行训练

val model=ALS.train(ratingsRDD,10,10,0.01)

在这里插入图片描述
7、针对用户***推荐前5部电影

model.recommendProducts(196,5).mkString("\n")

在这里插入图片描述
8、查看针对用户196推荐电影1154的评分

model.predict(196,1154)

在这里插入图片描述
9、针对电影958推荐给5个用户

model.recommendUsers(958,5).mkString("\t")

在这里插入图片描述
10、创建电影ID与名称的对照表

val itemRDD=sc.textFile("/home/data/u.item")

在这里插入图片描述

在这里插入图片描述
11、显示电影ID名称对应表的前5条记录

movieTitle.take(5).foreach(println)

在这里插入图片描述
12、查询ID为146的电影名称

movieTitle(146)

在这里插入图片描述
13、显示前5条推荐给用户196的电影名称

model.recommendProducts(196,5).map(rating=>(rating.product,movieTitle(rating.product),rating.rating)).foreach(println)

在这里插入图片描述

波点兔

关注

7
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
spark算法推荐系统实例

1、导入数据并查看val rawUserData=sc.textFile("file:/home/data/u.data")2、查看前五条信息，以及userid，itemid，评分信息textFile.take(5).foreach(println)rawUserData.map(_.split("\t")(1).toDouble).stats()//查看userid信息rawUse...
复制链接

扫一扫

专栏目录