Mahout---协同过滤算法示例

                                       ***基于物品的协同过滤***

Step 1:
准备样本集item.txt

1,101,5.0
1,102,3.0
1,103,2.5
2,101,2.0
2,102,2.5
2,103,5.0
2,104,2.0
3,101,2.5
3,104,4.0
3,105,4.5
3,107,5.0
4,101,5.0
4,103,3.0
4,104,4.5
4,106,4.0
5,101,4.0
5,102,3.0
5,103,2.0
5,104,4.0
5,105,3.5
5,106,4.0

Step 2:
在node11节点上执行命令,建立样本文件

vi /opt/apps/mahout/apache-mahout-distribution-0.10.2/item.txt

这里写图片描述

Step 3:
在三个节点执行命令,启动zookeeper
这里写图片描述
这里写图片描述
这里写图片描述

Step 4:
在node11节点上执行命令,启动HDFS和Yarn

start-all.sh

这里写图片描述

在node12节点上执行命令,启动Resourcemanager

yarn-daemon.sh start resourcemanager

这里写图片描述

Step 5:
打开浏览器,输入URL进行查看HDFS
192.168.80.11:50070
192.168.80.12:50070
这里写图片描述
这里写图片描述

打开浏览器,输入URL进行查看Yarn
192.168.80.11:8088
192.168.80.12:8088
这里写图片描述
这里写图片描述

Step 6:
在node11节点上执行命令,将文件上传到HDFS中

hadoop fs -mkdir /itemCF
hadoop fs -put /opt/apps/mahout/apache-mahout-distribution-0.10.2/test/item.txt /itemCF
hadoop fs -ls /itemCF

这里写图片描述

Step 7:
在node11节点上执行命令,运行Mahout

mahout recommenditembased -s SIMILARITY_LOGLIKELIHOOD  -i /itemCF/item.txt  -o /itemCF/tuijian --numRecommendations 5

这里写图片描述

Step 8:
执行命令,查看运行结果

hadoop fs -cat /itemCF/tuijian/part-r-00000

这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值