Hadoop——Windows系统下Hadoop单机环境搭建

6 篇文章 1 订阅

为了便于开发,我在本地Windows系统进行Hadoop搭建。

我使用的版本:hadoop-2.7.0。其他版本也可,搭建流程基本一样,所以参考这个教程一般不会有错。

1、下载安装包和插件

安装包hadoop-2.7.0.tar.gz

必要插件winutils-master

2、解压安装包

使用管理员身份运行cmd,到安装包对应目录下,输入:tar zxvf hadoop-2.7.0.tar.gz

Hadoop安装必须要安装JDK,这里就不赘述

3、配置环境变量

新建HADOOP_HOME,其实与JDK配置过程类似(E:\hadoop是我hadoop-2.7.0存放的位置,具体根据自己存放地址填写):

 系统环境变量path中添加%HADOOP_HOME%\bin:

 对E:\hadoop\hadoop-2.7.0\etc\hadoop\hadoop-env.cmd的JAVA_HOME进行修改,如下:

因为我的JDK在windows的Program Files目录,这里我使用PROGRA~1代替Program Files

JAVA_HOME安装目录不能有空格,不然启动hadoop会报错:Error: JAVA_HOME is incorrectly set.修改上面文件配置

4、测试

配置成功

5、替代和转移

从下载的winutils-master选择相应版本(这里我用的2.7.1,版本比较近,没有影响),将其bin文件夹替换hadoop-2.7.0\bin文件夹。同时,将bin下的hadoop.dll文件拷贝至C:\Windows\System32下一份

6、创建文件夹

在hadoop文件下创建tmp、namenode和datanode文件夹,以我的为例:

E:\hadoop\hadoop-2.7.0\tmp

E:\hadoop\hadoop-2.7.0\data\dfs\datanode

E:\hadoop\hadoop-2.7.0\data\dfs\namenode

为配置文件做准备

7、修改配置文件

需要修改四个配置文件(etc\hadoop目录下):core-site.xml,hdfs-site.xml,mapred-site.xml,yarn-site.xml

core-site.xml

这里端口我使用9000,端口要注意不被占用。可使用其它端口号。

查看端口是否占用命令:netstat -ano |findstr “post_number”

<configuration>
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://localhost:9000</value>
	</property>
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/E:/hadoop/hadoop-2.7.0/tmp</value>
	</property>
</configuration>
hdfs-site.xml
<configuration>
	<property>
		<name>dfs.replication</name>
		<!--  value 1,because it is single hadoop -->
		<value>1</value>
	</property>
	<property>
		<name>dfs.namenode.http-address</name>
		<value>localhost:50070</value>
	</property>
	<property>
		<name>dfs.namenode.name.dir</name>
          		<!--  Create the directory before use it -->
        		<value>/E:/hadoop/hadoop-2.7.0/data/dfs/namenode</value>
	</property>
	<property>
		<name>dfs.datanode.data.dir</name>
         		<!--  Create the directory before use it -->
        		<value>/E:/hadoop/hadoop-2.7.0/data/dfs/datanode</value>
	</property>

	<property>
    		<name>dfs.permissions</name>
    		<value>false</value>
	</property>
</configuration>

dfs.permissions设为false,比如可能后面进行HDFS相关操作,会出现org.apache.hadoop.security.AccessControlException: Permission denied: user=root...的错误

mapred-site.xml
<configuration>
	<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>
</configuration>

如果是mapred-site.xml.template则把.template后缀去掉

yarn-site.xml
<configuration>
<!-- Site specific YARN configuration properties -->
	<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>
    	<property>
        		<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
        		<value>org.apache.hadoop.mapred.ShuffleHandler</value>
    	</property>
</configuration>

8、初始化namenode

到bin目录下执行:hdfs namenode -format

(以管理员身份运行)

每次格式化时最好把datanode、namenode和tmp目录下的文件删掉,避免出现一些ClusterId之类的问题

9、启动Hadoop

到sbin目录下右键管理员身份运行start-all.cmd,或命令运行:start-all.cmd

出现上面四个子窗口。

10、验证

览器输如http://localhost:8080查看集群状态

http://localhost:50070/查看namenode管理界面

Hadoop——Hadoop单机搭建问题汇总

Hadoop——HDFS的Java API操作(文件上传、下载、删除等)

  • 5
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 在Windows环境下搭建Hadoop,需要进行以下步骤: 1. 安装Java环境:Hadoop是基于Java开发的,因此需要先安装Java环境。 2. 下载Hadoop:从官网下载Hadoop的二进制文件。 3. 解压Hadoop:将下载的Hadoop文件解压到指定目录下。 4. 配置Hadoop环境变量:将Hadoop的bin目录添加到系统的环境变量中。 5. 配置Hadoop的配置文件:修改Hadoop的配置文件,包括core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml。 6. 启动Hadoop:在命令行中输入start-all.sh命令启动Hadoop。 7. 验证Hadoop是否正常运行:在浏览器中输入http://localhost:50070/,查看Hadoop的状态。 以上就是在Windows环境下搭建Hadoop的步骤。 ### 回答2: Hadoop 是一个开源的、分布式的、可扩展的计算平台,它能够处理大规模数据集。本文将介绍如何在 Windows 环境下搭建 Hadoop。 步骤一:安装 Java 环境 Hadoop 是用 Java 写的,所以必须先安装 Java 环境。在 Oracle 官网上下载最新版本的 Java,安装过程中可以选择安装路径和设置环境变量。 步骤二:安装 Hadoop 1. 在 Apache 官网上下载 Hadoop 压缩包,并将其解压到某个目录下。 2. 打开 Hadoop 目录下的 etc/hadoop 目录,在该目录下创建以下文件: • core-site.xml • hdfs-site.xml • yarn-site.xml core-site.xml 配置: <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> hdfs-site.xml 配置: <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>/usr/local/hadoop_store/hdfs/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/usr/local/hadoop_store/hdfs/datanode</value> </property> <property> <name>dfs.namenode.secondary.http-address</name> <value>localhost:50090</value> </property> </configuration> yarn-site.xml 配置: <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> <property> <name>yarn.resourcemanager.address</name> <value>localhost:8032</value> </property> <property> <name>yarn.resourcemanager.scheduler.address</name> <value>localhost:8030</value> </property> <property> <name>yarn.resourcemanager.webapp.address</name> <value>localhost:8088</value> </property> </configuration> 步骤三:配置环境变量 1. 将 Hadoop 的 bin 目录加入 PATH 系统环境变量。 2. 添加 HADOOP_HOME 系统环境变量,其值为 Hadoop 的安装路径。 步骤四:启动 Hadoop 1. 打开命令行窗口,执行以下命令启动 Hadoop: • start-all.cmd 2. 检查启动状态: • jps 如果分别列出了 NameNode、SecondaryNameNode、DataNode、ResourceManager 和 NodeManager,则说明 Hadoop 启动成功。 至此,在 Windows 环境下成功搭建了 Hadoop。需要注意的是,HadoopWindows 上的性能并不理想,建议在 Linux 环境下使用。 ### 回答3: 要在Windows环境下搭建Hadoop,在开始之前,需要确保本地机器已经安装了Java SDK和SSH客户端工具,同时需要下载Hadoop分布式框架的Windows版本。 第一步是解压缩Hadoop的安装包,推荐将Hadoop的文件解压到本地的C盘根目录下,并将解压后的文件夹命名为hadoop。 第二步是编辑Hadoop的配置文件,将hadoop/etc/hadoop文件夹下的core-site.xml和hdfs-site.xml文件进行编辑。在core-site.xml中添加: ``` <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> ``` 在hdfs-site.xml中添加: ``` <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>/hadoop/tmp/dfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/hadoop/tmp/dfs/data</value> </property> </configuration> ``` 第三步是配置环境变量,将hadoop/bin文件夹添加到系统PATH路径中。 第四步是启动Hadoop,通过cmd命令行进入hadoop/bin目录下,输入start-all.cmd命令即可启动Hadoop的所有服务。 最后,可以通过http://localhost:50070/查看Hadoop集群的状态,如果能够显示出集群的各个节点信息,说明安装和配置已经成功完成。 需要提醒的是,在Windows环境下搭建Hadoop比较麻烦,需要乐于尝试和探索,同时需要有一定的操作系统和网络知识。因此,建议初学者首先从Linux环境下的Hadoop开始学习,等到对Hadoop有更深入的了解后再尝试在Windows环境下搭建。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值