Windows10安装hadoop3.1.3详细教程

一、安装包、配置文件下载

1.hadoop官网下载

https://hadoop.apache.org/release/3.1.3.html

2.下载winutils(hadoop在window运行的工具)

可以去GitHub上下载,最好下载对应版本的

3.直接百度网盘下载hadoop、winutils

https://pan.baidu.com/s/1a56R1YwOiyiB73RxSrg6_g

提取码:u1dz

二、安装hadoop

1.解压hadoop

把下载的hadoop-3.1.3.tar.gz压缩包解压到自己要安装的位置

2.配置环境变量

(1)在系统的变量中创建变量HADOOP_HOME,变量值为自己hadoop安装的位置,可以浏览目录找到刚刚解压的hadoop-3.1.3

(2)在path变量中添加hadoop的bin路径:%HADOOP_HOME%\bin;

3.验证是否安装成功

进入cmd,输入命令hadoop version查看hadoop是否安装成功

4.进入hadoop-3.1.3目录,创建data和temp文件夹

5.进入data目录,创建datanode和namenode文件夹

6.进入hadoop-3.1.3\etc\hadoop目录,用记事本或者其他编辑器打开如下文件并配置

(1)配置文件core-site.xml,添加

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>  
</configuration> 

(2)编辑文件hdfs-site.xml,添加

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>    
        <name>dfs.namenode.name.dir</name>    
        <value>/D:/hadoop/hadoop-3.1.3/data/namenode</value>    
    </property>    
    <property>    
        <name>dfs.datanode.data.dir</name>    
        <value>/D:/hadoop/hadoop-3.1.3/data/datanode</value>  
    </property>
</configuration>

这里要把两个“<value>”改成自己hadoop安装的地址。

(3)编辑文件mapred-site.xml,添加

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

(4)编辑文件yarn-site,xml,添加

<configuration>

<!-- Site specific YARN configuration properties -->

    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
        <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
    <property>
        <name>yarn.nodemanager.resource.memory-mb</name>
        <value>1024</value>
    </property>
    <property>
        <name>yarn.nodemanager.resource.cpu-vcores</name>
        <value>1</value>
    </property>

</configuration>

(5)如果之前安装的jdk不是默认安装到C盘的路径,要修改hadoop-env.cmd文件中的“set JAVA_HOME=”后面的路径,并且最好把jdk的安装路径用双引号引起来,以免出错

7.把之前下载的winutils里面的bin复制

覆盖到hadoop-3.1.3\bin中

8.在cmd命令控制台输入hdfs namenode -format格式化节点

9.进入hadoop-3.1.3\share\hadoop\yarn\timelineservice,复制一份到hadoop-3.1.3\share\hadoop\yarn

10.进入D:\hadoop\hadoop-3.1.3\sbin,运行start-all.cmd,启动

11.可以访问

(1)浏览器访问http://localhost:9870/

(2)浏览器访问http://localhost:8088/

到此安装成功。

### Windows安装 Hadoop 3.1.3详细指南 #### 下载 Hadoop 安装包 为了在 Windows 系统上成功安装 Hadoop 3.1.3,第一步是从 Apache 官方网站或其他可信源下载 Hadoop 的二进制版本。确保选择适合操作系统的稳定版压缩包(通常是 `.tar.gz` 文件)。可以通过以下链接访问官方镜像站点获取最新版本的 Hadoop[^1]。 #### 配置 Java 开发环境 Hadoop 是基于 Java 编写的框架,因此需要先安装 JDK 并设置 `JAVA_HOME` 环境变量。推荐使用 JDK 8 或更高版本。完成 JDK 安装后,在系统属性中的高级选项里添加如下路径至环境变量: ```plaintext JAVA_HOME=C:\Program Files\Java\jdk-<version> PATH=%JAVA_HOME%\bin;%PATH% ``` #### 解压 Hadoop 压缩包 将已下载的 Hadoop 压缩包解压到目标目录下,例如 `C:\hadoop-3.1.3`。此过程可以借助工具如 WinRAR 或者命令行下的 tar 工具来实现。 #### 设置 Hadoop 环境变量 类似于配置 JAVA_HOME,也需要定义 Hadoop 的环境变量以便于全局调用其脚本和程序。具体步骤包括但不限于编辑系统 PATH 和新增 HADOOP_HOME 变量: ```plaintext HADOOP_HOME=C:\hadoop-3.1.3 PATH=%HADOOP_HOME%\bin;%HADOOP_HOME%\sbin;%PATH% ``` #### 修改核心配置文件 进入解压后的 Hadoop 目录找到 conf 文件夹或者 etc/hadoop 子目录,这里包含了多个 XML 格式的配置文档。主要修改以下几个关键文件的内容: - **core-site.xml**: 添加必要的参数用于指定默认文件系统名称节点地址。 ```xml <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> ``` - **hdfs-site.xml**: 设定数据存储副本数以及其他 DFS 特性。 ```xml <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration> ``` - **mapred-site.xml**: 如果存在该模板,则更新 MapReduce 框架的相关设定。 ```xml <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> ``` - **yarn-site.xml**: YARN 资源管理器的具体调整依据实际需求而定。 ```xml <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration> ``` #### 启动 Hadoop 服务 通过命令提示符切换到 `%HADOOP_HOME%/sbin` 目录执行启动脚本来激活 NameNode, DataNode 等组件的服务进程。以下是常用的几个控制台指令: ```bash start-dfs.cmd # 初始化并开启 HDFS 名称节点和服务节点 start-yarn.cmd # 启动 YARN 计算框架 jps # 查看当前 JVM 进程状态确认各模块正常工作 ``` #### 测试验证集群功能 最后一步是测试整个部署流程是否正确无误。创建一个新的输入目录并将一些样本文件上传进去;接着运行 WordCount 示例作业观察输出结果是否符合预期。 ```bash hadoop fs -mkdir /input hadoop fs -put %LOCAL_PATH%/* /input/ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples*.jar wordcount /input /output hadoop fs -cat /output/* ``` 以上就是完整的 Windows 系统环境下搭建 Hadoop 3.1.3 单机模式的操作说明[^2]。
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值