Mapreduce

该博客详细介绍了MapReduce的编程模型搭建过程,包括Eclipse与Maven的配置,以及在Hadoop集群上运行WordCount应用、排序及二次排序的MapReduce程序。通过实验,读者可以学习如何创建MapReduce项目,编写并运行WordCount,实现数据的排序和二次排序。
摘要由CSDN通过智能技术生成

实验目的:
 搭建MapReduce编程模型
 配置Eclipse和Maven
 Hadoop集群与启动顺序
 MapReduce的WordCount应用
 书上代码练习
 学习编写一个MapReduce程序

实验要求:
 学会使用Maven创建一个工程项目
 配置好运行环境与运行条件
 结合上课课件自己输WordCount程序代码
 运行并得出结果
 在Hadoop集群中提取运行
 还原课本案例
 完成排序与二次排序的操作

实验环境:
 一台独立PC机或虚拟机
 已安装JDK
 已完成Hadoop平台的搭建
 已完成Eclipse安装成功
 已完成Maven

一、搭建mapreduce编程模型
1、新建mapreduce工程项目
在这里插入图片描述

2、配置pom.xml依赖文件
在这里插入图片描述
3、导入hadoop配置文件
在这里插入图片描述
4、启动Hadoop集群
5、查看节点状态
在这里插入图片描述
6、新建WordCountApp.java
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
7、新建SortApp.java
在这里插入图片描述
8、新建IntPair.java
在这里插入图片描述
9、新建SecondrySort.java
在这里插入图片描述
10、使用mvn clean package -DskipTests打包成hadoop-1.0-SNAPSHOT.jar
在这里插入图片描述
11、查看打包是否成功
在这里插入图片描述
12、将jar包上传/home/admin/hadoop-2.7.3/share/hadoop/mapreduce/下
在这里插入图片描述
二、MapReduce词频统计编程实例
1、将测试数据上传到HDFS目录中。
在这里插入图片描述
在这里插入图片描述

2、提交MapReduce作业到集群运行
在这里插入图片描述
3、查看作业输出结果。
在这里插入图片描述
在这里插入图片描述
三、使用MapReduce实现排序
1、将测试测试数据上传到HDFS目录中。
Hadoop fs -mkdir /sort
Hadoop fs sort.txt /sort
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2、提交MapReduce作业到集群运行。
在这里插入图片描述
3、查看作业输出结果。
在这里插入图片描述
一、四、使用MapReduce实现二次排序
1、提交作业到集群运行。
将测试数据上传到HDFS目录中。
在这里插入图片描述
在这里插入图片描述
2、提交MapReduce作业到集群运行。
在这里插入图片描述
3、查看作业输出结果。
在这里插入图片描述
4、浏览器查看
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值