1.推荐算法:
① 基于关系型规则的推荐 :
a、消费者购买A产品,那么他有多大可能购买B产品 b、购物车分析
② 基于内容的推荐 :
a、分析网页的内容自动分类,再将用户自动分类 ,将新进已分类的网页推荐给该群感兴趣的用户
③ 人口统计式的推荐:
a、将用户按照其个人属性(性别、年龄、教育背景、居住地、语言)作为分类的指针
④ 协同过滤式的推荐:
通过观察到的所有的用户对产品的评分,来推断用户的爱好,找出对产品频分相近的其他用户,他们喜欢的产品当前用户多半也会喜欢
协同式过滤式的推荐(推荐ALS算法 )
①缺点:冷启动,需要有历史数据
执行语句rawUserData.map(_.split('\t')(0).toDouble).stats()【stats统计算子】
count计数 mean平均值 stdev 标准偏差 max最大值 min最小值
ALS.train分为显示评分训练和隐式评分训练
显示:ALS.train(ratings.RDD[Rating],rank:Int,iterations:Int,lamba:Double):MatrixFactorizationModel
隐式:ALS.trainImplict(tating:RDD[Rating],rank: Int, iterations: Int, lambda: Double):MatrixFactorizationModel
Rating 是一种数据格式
rank将原本矩阵(n*m)分割成n*rank,和m*rank两个矩阵
iterations表示ALS重复计算的次数