mllib——实例3:ALS算法

ALS 是 spark 的协同过滤算法,已集成到 Spark 的 mllib 库中
数据ALStest.data来自/spark/data/mllib/als/test.data

import org.apache.spark.mllib.recommendation.Rating
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.mllib.recommendation.ALS

object ALS_test {
  def main(args: Array[String]): Unit = {
    //构建sc
    val conf = new SparkConf().setAppName("als").setMaster("local")
    val sc = new SparkContext(conf)
    //读入数据
    val rawData = sc.textFile("file:///test/ALStest.data")
    println(s"Count = ${rawData.count()}")  //一共多少条数据
    println(s"First:  ${rawData.first()}")  //查看第一条数据
    //数据类型转换成需要的Rating(int,int,double)
    val data = rawData.map(_.split(",") match{case Array(user,item,rate) =>
      Rating(user.toInt,item.toInt,rate.toDouble)})
    val model =ALS.train(data,10,10,0.01)
    val result = model.recommendProducts(2,5)
    result.foreach(println)

  }
}

可能会遇到爆栈错误,解决方法:
(1)降低迭代次数
(2)checkpoint

2. 使用电影数据集:
电影数据集 ml-100k.zip,下载地址:https://grouplens.org/datasets/movielens/
其中,u.dat是用户评分数据(包括用户id、电影id、评分、日期)
u.item是电影数据(包括电影id、电影名)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值