12.1推荐算法介绍
推荐引擎是最常见的机器学习应用。我们可以在各大购物网站看见这方面的应用。
Spark MLlib支持ALS(Alternating Least Squares)推荐算法,是机器学习的协同过滤推荐算法。机器学习的协同过滤推荐算法通过观察所有用户给产品的评价来推断每个用户的喜好,并向用户推荐适合的多个产品,也可以把某一产品推荐给多个用户。
协同过滤推荐的优缺点
优点 | 缺点 |
---|---|
·可以达到个性化推荐 | |
·不需要内容分析 | ·冷启动问题(Cold-start):如果没有历史数据就没办法分析 |
·可以发现用户新的兴趣点 | ·新用户问题:新用户没有评分,就不知道他的喜好 |
·自动化程度高 |
12.2“推荐引擎”大数据分析使用场景
假设有一个MoviesOnLine的在线电影网站,公司希望能运用大数据分析推荐引擎增加会员观看影片的次数,以增加营收。
12.3 ALS推荐算法的介绍
12.3.1用户对产品项目的评分
用户对产品项目的评分有两种方式。
·显示评分(Explicit Rating)
网站上的设计经常会请用户对某个产品进行评分,例如评1~5颗星。
Item A | Item B | Item C | Item D | Item E |
---|