Hadoop集群!将HDFS副本数设置为3;可以正常提交MapReduce运行!

本文介绍了如何将HDFS的副本数设置为3,详细步骤包括修改hdfs-site.xml配置文件。接着,文章讲解了基于MapReduce框架开发wordcount程序的过程,包括项目创建、引入HDFS相关jar包、代码编写、本地环境搭建和打包。最后,文章演示了在SSH上运行MapReduce的wordcount示例,并展示了运行结果。
摘要由CSDN通过智能技术生成

目录

一、将HDFS副本数设置为3

1、什么是HDFS副本数?

2.将副本数设置为3

二、基于MapReduce框架开发wordcount程序

1、什么是MapReduce框架?

2、 启动idea,新建一个maven项目

3、将HDFS相关的jar包引入到项目中

 4、代码开发

5、本地环境搭建

 三、打包项目

四、在ssh运行MapReduce提供的wordcount例子

 五、总结


一、将HDFS副本数设置为3

1、什么是HDFS副本数?

HDFS 数据副本概念:HDFS数据副本存放策略,副本的存放是HDFS可靠性和高性能的关键。优化的副本存放策略是HDFS区分于其他大部分分布式文件系统的重要特性。这种特性需要做大量的调优,并需要经验的积累。

2.将副本数设置为3

将HDFS副本数设置为3,我们需要修改虚拟机主机上的Hadoop配置文件。

首先先把虚拟机路径切换到Hadoop文件的配置路径,使用命令:cd $HADOOP_HOME/etc/hadoop,修改hdfs-site.xml文件,把副本数量设置为3。

具体如下图:

 这里我已经修改过来,使用的是查看命令,修改命令为:vi hdfs-site.xml,接着输入i进入编式。到这里我们的副本数就设置完成了。

二、基于MapReduce框架开发wordcount程序

1、什么是MapReduce框架?

MapReduce是一种分布式计算模型,用于大规模数据集(如TB级)并行运算。核心思想是分而治之,即先分后总。主要用来处理离线数据

基于MapReduce框架开发的程序称之为MapReduce程序。MapReduce程序由两个阶段组成: map和reduce,用户(即程序员)只需实现map()和reduce()两个函数,即可开发出分布式计算程序。

2、 启动idea,新建一个maven项目

3、将HDFS相关的jar包引入到项目中

将HDFS相关的jar包引入到项目中,目的是调用HDFS提供的相关的类、方法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值