【大数据技术与推荐系统(7)】Mahout推荐算法实战

本文详细介绍了Mahout作为Hadoop生态中的机器学习库,其在推荐系统领域的应用。内容涵盖Mahout的架构、算法类型,特别是协同过滤框架的实现,包括SVD和基于ALS的算法。此外,还讲解了如何利用Mahout构建推荐系统,包括数据模型、用户相似度计算、邻接定义及推荐算法评估方法,并提供了MovieLens和Book-Crossing数据集的推荐系统实现案例。
摘要由CSDN通过智能技术生成

Mahout概述

  • 基于Spark/Flink/H2O开发的数据挖掘/机器学习库
    • 截止2014年底,mahout不再接收任何MapReduce开发的算法,转向spark
  • 良好的扩展性和容错性
    • 充分利用了MapReduce/Spark/Flink 和HDFS 的扩展性和容错性
  • 属于Hadoop生态系统重要组成部分
  • 实现了大部分常用的数据挖掘算法
    • 聚类算法
    • 分类算法
    • 推荐算法

后端计算引擎

Hadoop MapReduce、Spark、H2O、Flink
在这里插入图片描述

Mahout架构:high-level

在这里插入图片描述
Mahout架构:low-level
在这里插入图片描述
Mahout提供的算法

在这里插入图片描述
Mahout分类算法
在这里插入图片描述
Mahout聚类算法
在这里插入图片描述
Mahout其他算法
在这里插入图片描述

Mahout推荐算法介绍

  • Mahout实现了协同过滤框架
    • 使用历史数据(打分,点击,购买等)作为推荐的依据
      • User-based: 通过发现类似的用户推荐商品。由于用户多变的特性,这种方法很难扩展;
      • Item-based:通过计算item之间相似度推荐商品。商品不易变化,相似度矩阵可离线计算得到。(诞生于Amazon)
      • MF-based:通过将原始的user-item矩阵分解成小的矩阵
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值