windows环境下搭建hadoop 3.1.2

一、下载所需文件

    1.JDK 8 下载地址:点击打开链接

    2.Hadoop 3.1.2下载地址:https://hadoop.apache.org/releases.html

    3.Windows下安装Hadoop工具 winutils  https://github.com/steveloughran/winutils

 注意:这里要选择与hadoop 版本对应的 winutils  https://github.com/steveloughran/winutils/tree/master/hadoop-3.0.0/bin

二、jdk8安装

    1.不会看这里点击打开链接

三、Hadoop环境配置   

 下载Hadoop,并解压到你的本地目录,我下载的是hadoop-3.1.2版本,解压在D:\hadoop-3.1.2。

 

四、配置Hadoop的环境变量

    路径:计算机 –>属性 –>高级系统设置 –>高级选项卡 –>环境变量 –> 单击新建

新建HADOOP_HOME变量 地址为D:\hadoop-3.1.2,示意图如下: 

这里写图片描述

上图换成你自己的hadoop目录即可。


新建HADOOP_CONF_DIR变量 地址为 %HADOOP_PREFIX%\etc\hadoop,如下图: 

这里写图片描述


新建YARN_CONF_DIR 变量 地址为%HADOOP_CONF_DIR%,如下图: 

这里写图片描述


最后 path 添加%HADOOP_HOME%/bin

对于win10,最后的效果如下:
        

五、配置Hadoop文件

    1.编辑“D:\hadoop-3.1.2\etc\hadoop”下的core-site.xml文件,将下列文本粘贴进去,并保存。


<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>D:/hadoop-3.1.2/tmp</value>
    </property>
    <property>
        <name>dfs.name.dir</name>
        <value>/D:/hadoop-3.1.2/name</value>
    </property>
    <property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

 2.编辑“D:\hadoop-3.1.2\etc\hadoop”目录下的mapred-site.xml(如果不存在将mapred-site.xml.template重命名为mapred-site.xml)文件,粘贴一下内容并保存。


<configuration>
    <property>
       <name>mapreduce.framework.name</name>
       <value>yarn</value>
    </property>
    <property>
       <name>mapred.job.tracker</name>
       <value>hdfs://localhost:9001</value>
    </property>
</configuration>

   3.编辑“D:\hadoop-3.1.2\etc\hadoop”目录下的hdfs-site.xml文件,粘贴以下内容并保存。

<configuration>
<property>
       <name>dfs.replication</name>
       <value>1</value>
   </property>
   <property>
       <name>dfs.namenode.name.dir</name>
       <value>/d:/hadoop-3.1.2/data/namenode</value>
   </property>
   <property>
       <name>dfs.datanode.data.dir</name>
     <value>/d:/hadoop-3.1.2/data/datanode</value>
   </property>
</configuration>

 

4.编辑“D:\hadoop-3.1.2\etc\hadoop”目录下的yarn-site.xml文件,粘贴以下内容并保存。

   <property>
       <name>yarn.nodemanager.aux-services</name>
       <value>mapreduce_shuffle</value>
   </property>
   <property>
       <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
       <value>org.apache.hadoop.mapred.ShuffleHandler</value>
   </property>
</configuration>

 5.编辑“D:\hadoop-3.1.2\etc\hadoop”目录下的hadoop-env.cmd文件,将JAVA_HOME用 @rem注释掉,

JAVA_HOME设置为

set JAVA_HOME=<填入你自己的JDK地址>,

并在尾部添加
set HADOOP_IDENT_STRING=%USERNAME%
set HADOOP_PREFIX=D:\hadoop-3.1.2
set HADOOP_CONF_DIR=%HADOOP_PREFIX%\etc\hadoop
set YARN_CONF_DIR=%HADOOP_CONF_DIR%
set PATH=%PATH%;%HADOOP_PREFIX%\bin
 

注意,这里有坑,如果你的JDK安装路径有空格,则必须用如下的软链接方法解决。

/** 问题如下:

在windows中安装hadoop,JAVA_HOME中如果有空格,就会报下面的错误

hadoop Error: JAVA_HOME is incorrectly set.

解决方案,设置软连接,重新配置JAVA_HOME

使用 cmd 创建软连接 ,例子如下:mklink /J D:\tools\java "D:\Program Files\Java\jdk1.7.0_67"  

然后在hadoop-env.cmd里面设置:

set JAVA_HOME=D:\tools\java

**/

六、替换文件

下载winutils相关,hadoop在windows上运行需要winutils支持和hadoop.dll等文件。

下载对应版本的就可以,例如我用的是3.1.2,可以直接下载3.0.0的就好。然后将全部bin目录文件替换至hadoop目录下的bin目录

下载链接是:https://github.com/steveloughran/winutils/tree/master/hadoop-3.0.0/bin

运行hadoop

  • 打开cmd,执行 hdfs namenode -format ,执行没有报错,说明成功。
  • 然后进入hadoop目录下sbin文件夹,双击start-all.cmd (但是失败了)
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
### 回答1: 在Windows环境搭建Hadoop,需要进行以下步骤: 1. 安装Java环境Hadoop是基于Java开发的,因此需要先安装Java环境。 2. 下载Hadoop:从官网下载Hadoop的二进制文件。 3. 解压Hadoop:将下载Hadoop文件解压到指定目录下。 4. 配置Hadoop环境变量:将Hadoop的bin目录添加到系统的环境变量中。 5. 配置Hadoop的配置文件:修改Hadoop的配置文件,包括core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml。 6. 启动Hadoop:在命令行中输入start-all.sh命令启动Hadoop。 7. 验证Hadoop是否正常运行:在浏览器中输入http://localhost:50070/,查看Hadoop的状态。 以上就是在Windows环境搭建Hadoop的步骤。 ### 回答2: Hadoop 是一个开源的、分布式的、可扩展的计算平台,它能够处理大规模数据集。本文将介绍如何在 Windows 环境搭建 Hadoop。 步骤一:安装 Java 环境 Hadoop 是用 Java 写的,所以必须先安装 Java 环境。在 Oracle 官网上下载最新版本的 Java,安装过程中可以选择安装路径和设置环境变量。 步骤二:安装 Hadoop 1. 在 Apache 官网上下载 Hadoop 压缩包,并将其解压到某个目录下。 2. 打开 Hadoop 目录下的 etc/hadoop 目录,在该目录下创建以下文件: • core-site.xml • hdfs-site.xml • yarn-site.xml core-site.xml 配置: <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> hdfs-site.xml 配置: <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>/usr/local/hadoop_store/hdfs/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/usr/local/hadoop_store/hdfs/datanode</value> </property> <property> <name>dfs.namenode.secondary.http-address</name> <value>localhost:50090</value> </property> </configuration> yarn-site.xml 配置: <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> <property> <name>yarn.resourcemanager.address</name> <value>localhost:8032</value> </property> <property> <name>yarn.resourcemanager.scheduler.address</name> <value>localhost:8030</value> </property> <property> <name>yarn.resourcemanager.webapp.address</name> <value>localhost:8088</value> </property> </configuration> 步骤三:配置环境变量 1. 将 Hadoop 的 bin 目录加入 PATH 系统环境变量。 2. 添加 HADOOP_HOME 系统环境变量,其值为 Hadoop 的安装路径。 步骤四:启动 Hadoop 1. 打开命令行窗口,执行以下命令启动 Hadoop: • start-all.cmd 2. 检查启动状态: • jps 如果分别列出了 NameNode、SecondaryNameNode、DataNode、ResourceManager 和 NodeManager,则说明 Hadoop 启动成功。 至此,在 Windows 环境下成功搭建Hadoop。需要注意的是,HadoopWindows 上的性能并不理想,建议在 Linux 环境下使用。 ### 回答3: 要在Windows环境搭建Hadoop,在开始之前,需要确保本地机器已经安装了Java SDK和SSH客户端工具,同时需要下载Hadoop分布式框架的Windows版本。 第一步是解压缩Hadoop的安装包,推荐将Hadoop的文件解压到本地的C盘根目录下,并将解压后的文件夹命名为hadoop。 第二步是编辑Hadoop的配置文件,将hadoop/etc/hadoop文件夹下的core-site.xml和hdfs-site.xml文件进行编辑。在core-site.xml中添加: ``` <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> ``` 在hdfs-site.xml中添加: ``` <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>/hadoop/tmp/dfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/hadoop/tmp/dfs/data</value> </property> </configuration> ``` 第三步是配置环境变量,将hadoop/bin文件夹添加到系统PATH路径中。 第四步是启动Hadoop,通过cmd命令行进入hadoop/bin目录下,输入start-all.cmd命令即可启动Hadoop的所有服务。 最后,可以通过http://localhost:50070/查看Hadoop集群的状态,如果能够显示出集群的各个节点信息,说明安装和配置已经成功完成。 需要提醒的是,在Windows环境搭建Hadoop比较麻烦,需要乐于尝试和探索,同时需要有一定的操作系统和网络知识。因此,建议初学者首先从Linux环境下的Hadoop开始学习,等到对Hadoop有更深入的了解后再尝试在Windows环境搭建

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值