win10下安装高版本hadoop 3.1.2

一、安装环境

win10 64位
hadoop3.1.2
jdk1.8

二、安装JDK1.8

这里不再赘述

三、安装hadoop

3.1官网下载hadoop

https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-3.1.2/hadoop-3.1.2.tar.gz

注意:之前下载的是hadoop-3.2.1.tar.gz最高版本,但是一直报posix错误,可能是因为winutils的版本对应有问题,所以切换成了hadoop-3.1.2版本。

3.2解压,配置环境变量

将hadoop-3.1.2.tar.gz copy到要安装的目录,CMD进入目录, 输入

start winrar x -y hadoop-3.1.2.tar.gz

执行解压。这里如果直接解压的话,会报路径过长错误。

将解压目录添加环境变量中,如下图,这里是直接在解压在F盘目录下:

å®è£å解ååçè·¯å¾

添加系统变量,并在PATH添加路径:

å¨è¿éæå¥å¾çæè¿°

å¨path中添å ä»¥ä¸è·¯å¾å¨è¿éæå¥å¾çæè¿°

在jdk和hadoop环境配置好后,在命令行窗口上分别执行:

java -version

能得到java版本输出,说明配置成功

å¨è¿éæå¥å¾çæè¿°

hadoop version

能得到hadoop版本输出,说明配置成功

å¨è¿éæå¥å¾çæè¿°
3.3 修改配置文件

需要修改的文件在解压后的目录下,hadoop-3.1.2\etc\hadoop\

用记事本打开hadoop-env.cmd文件,找到**set JAVA_HOME=%JAVA_HOME%**一行,将其值修改为jdk所在目录,如果目录带有空格,可以通过下面两种方式处理:这里以安装目录为C:\Program Files\Java\jdk1.8.0_181为例,因为Program Files中存在空格,若是直接使用会出现错误,可以下面两种方式之一进行处理:

只需要用PROGRA~1 代替Program Files,即改为C:\PROGRA~1\Java\jdk1.8.0_18
或是使用双引号改为 “C:\Program Files”\Java\jdk1.8.0_181

在core-site.xml 文件中添加:

<configuration>
	<property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9001</value>
    </property>
</configuration>

在mapred-site.xml文件中添加:

<configuration>
	<property>
      	  <name>mapreduce.framework.name</name>
     	  <value>yarn</value>
    </property>
</configuration>

在yarn-site.xml文件中添加:

<configuration>
<!-- Site specific YARN configuration properties -->
	<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>

	<property>
		<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
		<value>org.apache.hahoop.mapred.ShuffleHandler</value>
	</property>
</configuration>

4.在解压的根目录下创建data文件夹,并在data下创建namenode和datanod两个子文件夹;
在hdfs-site.xml文件添加:

<configuration>
	<property>
    	<name>dfs.replication</name>
    	<value>1</value>
  	</property>

  	<property>
    	<name>dfs.namenode.name.dir</name>
    	<value>/C:/ProgramFiles/ApacheSoftwareFoundation/hadoop-3.1.2/workspace/namenode</value>
  	</property>

  	<property>
    	<name>dfs.datanode.data.dir</name>
    	<value>/C:/ProgramFiles/ApacheSoftwareFoundation/hadoop-3.1.2/workspace/datanode</value>
  	</property>
</configuration>

3.4 替换bin目录下的文件

下载的Hadoop不支持Windows系统,需要替换bin目录下的文件方便在Windows上运行。这也是掉坑来的地方了!!!!
在网上下载到的hadooponwindows-master.zip 以及winutils中应该是只适合hadoop 3.0.0及其以下,尝试过hadooponwindows-master.zip以及winutils中最高的版本3.0.0,启动hadoop都会出现下面的错误:Error starting NodeManager、UnsatisfiedError
折腾了好久(低版本的hadoop还没下载完毕),终于找到3.1.0版本winutils,下载后直接替换掉hadoop目录下bin文件即可:

https://github.com/zyj108/apache-hadoop-3.1.0-winutils

重新启动

start-all.cmd

如果报错JAVA_HOME NOT FOUND,则打开/etc/hadoop/hadoop-env.cmd文件

可以看到resourcemanager.ResourceManager: Error starting ResourceManager启动失败的日志,报了类TimelineCollectorManager找不到的错误,

å¨è¿éæå¥å¾çæè¿°
解决方法: HADOOP_HOME\share\hadoop\yarn\timelineservice 将这个文件夹下的hadoop-yarn-server-timelineservice-3.1.1.jar 包 复制到这个路径下 HADOOP_HOME\share\hadoop\yarn 即可解决。

如果报错:java.io.IOException: NameNode is not formatted.

则执行命令:hdfs namenode -format

如果执行hdfs namenode -format报错: ERROR namenode.NameNode: Failed to start namenode.
java.lang.UnsupportedOperationException

hadoop-3.2.1会有这个问题,具体解决方案请参考:https://kontext.tech/column/hadoop/379/fix-for-hadoop-321-namenode-format-issue-on-windows-10

如果报错storage directory does not exist or is not acceeible

在workspace目录下新建文件夹namenode文件夹。

3.5 执行start-all.cmd

会自动开启四个新的命令行窗口,窗口没打印异常即启动成功,再执行命令:

jps

可以看到DataNode、NameNode、NodeManager、ResourceManager正常启动。

å¨è¿éæå¥å¾çæè¿°
3.6 访问管理GUI

启动成功后,可以访问GUI页面
http://localhost:8088/

å¨è¿éæå¥å¾çæè¿°

http://localhost:9870/

å¨è¿éæå¥å¾çæè¿°
参考资料
https://blog.csdn.net/qq_33398459/article/details/86687379
https://blog.csdn.net/qq_24125575/article/details/76186309
https://blog.csdn.net/houwanle/article/details/81773832

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值