Hadoop:MapReduce进行文件单词量的统计,将结果输出

该实验指导详细介绍了如何使用Hadoop的MapReduce进行编程,涵盖了从在Windows和Linux环境下启动Hadoop集群,到编写Map、Reduce代码,再到运行和分析结果的全过程。实验涉及Hadoop、Java、HDFS和YARN等关键知识点,旨在提升学生对分布式计算的理解和实践能力。
摘要由CSDN通过智能技术生成

实验 MapReduce编程

1 实验目的

  1. 使用Hadoop的分布式存储HDFS系统存储数据;
  2. 使用MapReduce进行编程;
  3. 通过YARN资源管理框架运行MapReduce,验证结果。

2 实验内容

启动Hadoop集群,使用命令行方式往文件系统中添加数据,是MapReduce进行文件单词量的统计,将结果输出。

包括在Windows中实现和在Linux的Hadoop集群中实现。

3 实验知识点

  1. Hadoop;
  2. Java;
  3. HDFS;
  4. MapReduce编程;
  5. Windows下MapReduce运行分析;
  6. Linux下MapReduce运行分析。

4 实验时长

    8学时。

5 实验环境

  1. Linux;
  2. Hadoop;
  3. Java

6 实验过程

1.创建Java项目testmr

2.在项目下新建lib文件夹,将jar包拷贝进入

 3.在java bulid path中引入lib文件夹中所有的jar包

 4 编写 map、reduce、job代码

map类:

 reduce类:

 job类:

 5.运行job

 6.查看D盘文件夹中的运行结果

7.修改在linux上执行的代码

 8.使用eclipse的export功能导出jar包

  

 

 

 9.在linux集群中启动hdfs、yarn。

使用start-dfs.sh和start-yarn.sh命令,启动hdfs和yarn

10.将jar上传到linux中,并.使用 hadoop jar WordCountDriver.jar 运行程序

 11.在hdfs中查看运行结果。

输入命令hdfs dfs -cat /dd/output.txt/part-r-00000查看运行结果。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值