Mapreduce

最新推荐文章于 2022-10-01 13:27:48 发布

咋不呀-

最新推荐文章于 2022-10-01 13:27:48 发布

阅读量162

点赞数

本文链接：https://blog.csdn.net/weixin_43853006/article/details/90579541

版权

该博客详细介绍了MapReduce的编程模型搭建过程，包括Eclipse与Maven的配置，以及在Hadoop集群上运行WordCount应用、排序及二次排序的MapReduce程序。通过实验，读者可以学习如何创建MapReduce项目，编写并运行WordCount，实现数据的排序和二次排序。

摘要由CSDN通过智能技术生成

实验目的：
 搭建MapReduce编程模型
 配置Eclipse和Maven
 Hadoop集群与启动顺序
 MapReduce的WordCount应用
 书上代码练习
 学习编写一个MapReduce程序

实验要求：
 学会使用Maven创建一个工程项目
 配置好运行环境与运行条件
 结合上课课件自己输WordCount程序代码
 运行并得出结果
 在Hadoop集群中提取运行
 还原课本案例
 完成排序与二次排序的操作

实验环境：
 一台独立PC机或虚拟机
 已安装JDK
 已完成Hadoop平台的搭建
 已完成Eclipse安装成功
 已完成Maven

一、搭建mapreduce编程模型
1、新建mapreduce工程项目
在这里插入图片描述

2、配置pom.xml依赖文件
在这里插入图片描述
3、导入hadoop配置文件

4、启动Hadoop集群
5、查看节点状态

6、新建WordCountApp.java

7、新建SortApp.java

8、新建IntPair.java

9、新建SecondrySort.java

10、使用mvn clean package -DskipTests打包成hadoop-1.0-SNAPSHOT.jar
在这里插入图片描述
11、查看打包是否成功

12、将jar包上传/home/admin/hadoop-2.7.3/share/hadoop/mapreduce/下

二、MapReduce词频统计编程实例
1、将测试数据上传到HDFS目录中。

2、提交MapReduce作业到集群运行
在这里插入图片描述
3、查看作业输出结果。

三、使用MapReduce实现排序
1、将测试测试数据上传到HDFS目录中。
Hadoop fs -mkdir /sort
Hadoop fs sort.txt /sort

2、提交MapReduce作业到集群运行。

3、查看作业输出结果。

一、四、使用MapReduce实现二次排序
1、提交作业到集群运行。
将测试数据上传到HDFS目录中。
在这里插入图片描述

2、提交MapReduce作业到集群运行。

3、查看作业输出结果。

4、浏览器查看