hadoop-小案例实现qq好友推荐

一、本文主要是hadoop hdfs文件系统和mapReduce离线计算框架整合小案例

二、前提是读者已经部署了hadoop的namenode、datanode、secodaynamenode

三、分析需求:

    1、好友列表一个人有多个好友,那么如何实现好友推荐呢?简单的二度关系这里是使用

    2、我的好友的好友有可能是我认识的人,所以将来进行好友推荐的时候就可以将这些人推荐给我(这里只是简单的关系,其实还可以做的复杂那就是我的好友的好友跟我有三个以上相同的好友才推荐给我这里我们不实现)

     3、比如我们的好友关系存储形式如下:

hadoop	hello
hdfs	world
xiaopi	w3c
w3c	xiaoming	
hello	world

那么我们这里可以得道的二度关系就需要笛卡尔积去获取了也就是hadoop-----hello ------world 这里 hadoop 和world 也就存在二度关系

程序里怎么实现呢?

四、1、启动namenode

[root@localhost bin]# ./hadoop start-all.sh 

       2、将我们的测试数据上传到hdfs文件系统

rz 选择测试文件上传到服务器
./hadoop dfs -put relation.txt  /home/ma/input/ 上传测试文件到hdfs文件系统

     

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值