MapReduce课程设计-----好友推荐功能

最新推荐文章于 2024-03-24 11:09:34 发布

-我不是码农

最新推荐文章于 2024-03-24 11:09:34 发布

阅读量829

点赞数 2

文章标签： hadoop 分布式 mapreduce

本文链接：https://blog.csdn.net/qq_53025556/article/details/127118667

版权

2.1编写FriendsRecommend

2.2编写FriendsRecommendMapper

2.3编写FriendsRecommendReduce

3.在项目右侧Maven打包一下package

一、项目说明

互为推荐关系

非好友的两个人之间存在相同好友则互为推荐关系

朋友圈两个非好友的人，存在共同好友人数越多，越值得推荐

存在一个共同好友，值为1；存在多个值累加

二、程序需求

1.需求：

程序要求，给每个人推荐可能认识的人

互为推荐关系值越高，越值得推荐

每个用户，推荐值越高的可能认识的人排在前面

2.数据：

数据使用空格分割

每行是一个用户以及其对应的好友

每行的第一列名字是用户的名字，后面的是其对应的好友

创建friends.txt文本：

xiaoming laowang renhua linzhiling
laowang xiaoming fengjie
renhua xiaoming ligang fengjie
linzhiling xiaoming ligang fengjie guomeimei
ligang renhua fengjie linzhiling
guomeimei fengjie linzhiling
fengjie renhua laowang linzhiling guomeimei

三、程序内容

1.xshell启动集群

使用命令start-dfs.sh启动HDFS

start-dfs.sh

使用命令start-yarn.sh启动Yarn

start-yarn.sh

2.在idea里面编写代码

创建java项目：

分别创建FriendsRecommend、FriendsRecommendMapper、FriendsRecommendReduce项目

2.1编写FriendsRecommend

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class FriendsRecommend {
    public static void main(String[] args) throws Exception{
        //获取虚拟机配置信息
        Configuration configuration = new Configuration();
        //创建Job对象
        Job job = Job.getInstance(configuration);
        job.setJarByClass(FriendsRecommend.class);

        //Map端
        job.setMapperClass(FriendsRecommendMapper.class);
        job.setMapOutputKeyC