Hadoop windows版安装和集群

本文详细介绍了在Windows上安装Hadoop 2.8.5的步骤,包括配置JDK,下载并覆盖winutils,修改配置文件如core-site.xml、hdfs-site.xml等。还涉及了集群配置,通过格式化hdfs,启动dfs和yarn。同时,文章提到了Linux环境的配置问题,SpringBoot集成Hadoop的注意事项,以及HDFS客户端的使用,包括上传、查询和下载文件的操作。此外,列举了Hadoop相关服务的端口号,并讨论了遇到的安全模式问题和MRAppMaster加载错误的解决方法。
摘要由CSDN通过智能技术生成

安装

安装jdk:操作。jdk安装目录不能有空格
下载: hadoop-2.8.5.tar.gz
下载: winutils-master.zip。Hadoop在windows下运行工具
解压hadoop-2.8.5.tar.gz到D:\hadoop-2.8.5
将winutils-master.zip中hadoop-2.8.3下文件直接覆盖到D:\hadoop-2.8.5

配置

在路径D:\hadoop-2.8.5\etc\hadoop下修改文件
①core.site.xml(配置默认hdfs的访问端口)

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://192.0.0.77:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name><!--临时文件夹 -->
        <value>file:/hadoop/tmp</value>
    </property>
    <!--单机下面不用配置 -->
    <property>
        <name>fs.checkpoint.period</name><!--检查时间,同步时间 -->
        <value>60</value>
    </property>
    <property>
        <name>fs.checkpoint.size</name><!--检查大小,同步大小 -->
        <value>67108864</value>
    </property>
</configuration>

②hdfs-site.xml

<configuration>
    <property>
        <name>dfs.replication</name><!--副本个数,不超过节点数量 -->
        <value>2</value>
    </property>
    <property>    
        <name>dfs.namenode.name.dir</name>    
        <value>file:/hadoop/data/dfs/namenode</value>    
    </property>    
    <property>    
        <name>dfs.datanode.data.dir</name>    
        <value>file:/hadoop/data/dfs/datanode</value>  
    </property>
    <property>
        <name>dfs.permissions</name><!--访问权限 -->
        <value>false</value>
    </property>
    <property>
		<name>dfs.datanode.du.reserved</name>
		<!-- reserved space in bytes -->
		<value>1000000000</value>
		<description>预留磁盘的空间大小</description>
	</property>
    <!--单机下面不用配置 -->
    <property>
        <name>dfs.namenode.secondary.http-address</name><!--检查点节点, -->
        <value>192.0.0.77:50090</value>
    </property>
</configuration>

③将mapred-site.xml.template 名称修改为 mapred-site.xml 后再修改内容(设置mr使用的框架,这里使用yarn)

<configuration>
     <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

④yarn-site.xml(这里yarn设置使用了mr混洗)

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
        <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
    <property>
        <name>yarn.resourcemanager.webapp.address</name><!--集群状态地址,默认端口8088 -->
        <value>192.0.0.77:8077</value>
    </property>
</configuration>

⑤hadoop-env.cmd
设置JAVA_HOME的值(如果这里使用了带空格的Program Files路径将会报错!)
set JAVA_HOME=C:\Java\jdk1.8.0_05
⑥集群ip配置
新建slaves文件,把全部节点ip以换行的形式列出来,类似于白名单

#此步骤只在主节点执行
进入D:\hadoop-2.8.5\bin目录,格式化hdfs
在cmd中运行命令 hdfs namenode -format

进入D:\hadoop-2.8.5\sbin目录
start-dfs.cmd文件最上面添加 cd D:\hadoop-2.8.5\bin
在cmd中运行命令start-all.cmd

http://localhost:8077查看集群状态
http://localhost:50070查看Hadoop状态

linux配置

遇到Permission denied (publickey,password)如下处理:

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
cat ~/
  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值