Windows10环境安装hadoop及配置

Windows10环境安装hadoop及配置

一. Windows10环境下安装 

    1.  下载安装JDK1.8,并配置环境变量,注意:jdk路径不要包含空格

   以下这种jdk配置的路径中就有空格,不能使用

    2.  下载Hadoop镜像安装文件,下载地址:https://hadoop.apache.org/releases.html

 

3.  解压Hadoop镜像文件到磁盘目录下,注意:可以解压在非C盘下,存储目录不要包含中文空格

4.  配置HADOOP_HOME环境变量,

 

4.1、并在系统环境变量Path中添加Hadoop环境变量    

        %HADOOP_HOME%\bin

       %HADOOP_HOME%\sbin

4.2、配置jdk路径

在 D:\software\hadoop\hadoop-3.3.0\etc\hadoop  路径下面的  hadoop-env.cmd 文件  ,

  注意: 无论是配置的JAVA_HOME环境变量,还是这种自定义的jdk路径,他们中不能含有空格

 

5. 打开cmd窗口,输入hadoop version命令验证

备注: 若出现 Error: JAVA_HOME is incorrectly set. Please update F:\hadoop\conf\hadoop-env.cmd的报错,则是因为JAVA_HOME环境变量配置的路径含有空格的原因

6.  Hadoop伪分布式部署配置

 a.  下载windows专用二进制文件和工具类依赖库: hadoop在windows上运行需要winutils支持和hadoop.dll等文件

    https://github.com/steveloughran/winutils

     在github仓库中找到对应版本的二进制库hadoop.dll和winutils.exe文件,然后把文件拷贝到hadoop解压的bin目录中去

注意:  hadoop.dll等文件不要与hadoop冲突,若出现依赖性错误可以将hadoop.dll放到C:\Windows\System32下一份

   b.  修改etc目录下的core-site.xml文件 

   <configuration>

   <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
   </property> 
    <property>  
     <name>hadoop.security.authorization</name>  
      <value>false</value>  
    </property>

    <property>
        <name>hadoop.tmp.dir</name>
        <value>/D:/software/hadoop/hadoop-3.3.0/tmp</value>
    </property>

  </configuration>

  注意:windows目录路径要改成使用正斜杠,且磁盘名称最前面也需要一个正斜杠

   c.  修改hdfs-site.xml配置文件

     <configuration>

     <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>  

   <!-- 设置名称节点位置 存储名称表(fsimage)的位置-->

   <property>
        <name>dfs.namenode.name.dir</name>
        <value>/D:/software/hadoop/hadoop-3.3.0/data/namenode</value>
    </property>
       <!-- 确定DFS数据节点应在本地文件系统上的哪个位置存储其块 -->
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/D:/software/hadoop/hadoop-3.3.0/data/datanode</value>
    </property>  
   
   <property>
        <name>dfs.permissions.enabled</name>
        <value>false</value>
   </property>

   <property>
        <name>dfs.client.use.datanode.hostname</name>
        <value>true</value>
   </property>

   </configuration>

    注意:windows目录路径要改成使用正斜杠,且磁盘名称最前面也需要一个正斜杠

   d.   节点格式化

        在cmd窗口执行命令:hdfs namenode -format

       执行成功结果:表示节点格式化成功

多出data文件夹

 7. 启动&关闭Hadoop

     a.  进入Hadoop的sbin目录下执行start-dfs.cmd启动Hadoop     

     b.  Web界面查看HDFS信息,在浏览器输入http://localhost:9870/,可访问NameNode

  • 11
    点赞
  • 42
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在 Windows 上安装 Hadoop 需要一些额外的配置。步骤如下: 1. 下载 Hadoop 的 Windows 版本。 2. 解压 Hadoop 到一个目录。 3. 配置 JAVA_HOME 环境变量。 4. 修改 Hadoop配置文件,包括 core-site.xml,hdfs-site.xml 和 mapred-site.xml。 5. 在命令行中运行 Hadoop 的命令来启动和配置 Hadoop 集群。 注意: Hadoop 在 Windows 上的性能可能不如在 Linux 上的性能。 ### 回答2: Hadoop是一个开源的分布式计算框架,用于处理大规模的数据集。以下是在Windows上安装配置Hadoop的步骤。 1.准备工作 在开始安装之前,请确保您拥有以下工具: Windows电脑(64位) Java JDK(版本为1.7或更高版本) Hadoop(版本为2.7.1或更高版本) 2.安装Java JDK 访问Oracle官方网站以下载最新的Java JDK(Java SE Development Kit)版本。下载完成后,安装JDK并配置JAVA_HOME环境变量。在安装Java时,确保安装JDK而不是JRE。 3.安装Hadoop 下载所需版本的Hadoop,并解压缩至本地目录,比如:D:\hadoop-3.2.2。 4.配置环境变量 将Hadoop bin目录添加至PATH环境变量中。 5.配置Hadoop环境 进入D:\hadoop-3.2.2\etc\hadoop目录并打开hadoop-env.cmd文件。在文件末尾添加以下语句: set JAVA_HOME=D:\java\jdk-13.0.2 set HADOOP_HOME=D:\hadoop-3.2.2 6.配置Hadoop核心文件 打开D:\hadoop-3.2.2\etc\hadoop\core-site.xml文件,并添加以下代码: <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> 7.配置Hadoop HDFS文件系统 打开D:\hadoop-3.2.2\etc\hadoop\hdfs-site.xml文件,并添加以下代码: <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/D:/hadoop-3.2.2/hadoopdata/namenode</value> </property> <property> <name>dfs.datanode.name.dir</name> <value>file:/D:/hadoop-3.2.2/hadoopdata/datanode</value> </property> </configuration> 8.格式化Hadoop文件系统 打开命令提示符,输入以下命令: D:\hadoop-3.2.2>d: D:\hadoop-3.2.2>cd D:\hadoop-3.2.2\bin D:\hadoop-3.2.2\bin>hadoop namenode -format 9.启动Hadoop 在命令提示符中输入以下命令以启动Hadoop: D:\hadoop-3.2.2\bin>start-all.cmd 10.验证Hadoop是否运行成功 在浏览器地址栏中输入http://localhost:50070/,如果看到Hadoop的webUI和集群的详细信息,则代表Hadoop已经成功运行。 通过以上步骤,您已经成功地在Windows上安装配置Hadoop。如果需要进一步了解Hadoop的使用方法,请参考官方文档或其他教程。 ### 回答3: Hadoop是一个开源的分布式计算平台,它可以方便地处理大规模数据集的存储和分析。本文将介绍如何在Windows上安装配置Hadoop。 第一步:安装Java Hadoop基于Java开发,所以需要先安装Java。可以从Oracle官网下载Java并按照提示安装安装完成后,打开命令提示符窗口,输入“java -version”命令,确认Java已经正确安装。 第二步:下载Hadoop 从Apache官网下载Hadoop,选择合适版本并下载压缩包。解压缩后将Hadoop文件夹移动到一个合适的位置,例如C盘根目录,重命名为“hadoop”。 第三步:配置Hadoop环境变量 为了方便使用Hadoop,需要将Hadoop路径添加到系统环境变量中。在Windows系统中,可以右键点击“此电脑”图标,选择“属性”菜单,在弹出的窗口中选择“高级系统设置”,然后选择“环境变量”选项卡。在“系统变量”窗口中添加以下两个变量: HADOOP_HOME C:\hadoop Path %HADOOP_HOME%\bin;%HADOOP_HOME%\sbin 注意:在Window系统中配置环境变量时,路径分隔符使用“;”,而不是Unix/Linux中的“:”。 第四步:配置Hadoop配置文件 进入Hadoop文件夹中的“etc\hadoop”目录,找到core-site.xml文件,修改以下内容: <configuration> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property> </configuration> 找到hdfs-site.xml文件,修改以下内容: <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/hadoop/hdfs/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/hadoop/hdfs/datanode</value> </property> </configuration> 找到mapred-site.xml.template,将其重命名为mapred-site.xml,修改以下内容: <configuration> <property> <name>mapred.job.tracker</name> <value>localhost:9001</value> </property> </configuration> 第五步:启动Hadoop 打开命令提示符窗口,进入Hadoop的bin目录,执行以下命令: start-all.cmd 这将启动所有Hadoop服务。可以在浏览器中输入“localhost:50070”来访问Hadoop的Web界面,查看Hadoop集群的运行状态。 至此,Hadoop安装配置完成。通过对Hadoop的学习和掌握,可以处理海量数据集,应用于大数据的存储和分析等方面。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值