Windows下Hadoop安装部署

安装

配置文件修改

常用端口说明

出错处理

 

Hadoop依赖于Java运行环境,因此需要先安装Java运行环境,再安装部署Hadoop。

安装

以2.9.2为例进行说明(因winutils最高支持到2.9.2)。

  • 到Hadoop网站http://hadoop.apache.org/releases.html下载二进制版本;解压到目标路径(如D:\hadoop);
  • 到github网站https://github.com/cdarlint/winutils下载winutils(编译好的hadoop的windows版本二进制文件);复制到hadoop安装目录下的bin目录。

启动

文件复制好后,按照第二节的方式修改配置文件,然后格式化文件系统。在bin目录下执行:hdfs namenode -format

格式化完成后,到sbin目录下,启动hadoop:start-all.cmd
通过执行stop-all.cmd停止Hadoop。

查看

在浏览器中访问http://localhost:50070查看Hadoop状态。

访问http://localhost:8088查看集群状态。

配置文件修改

配置文件在安装目录的etc目录下,修改以下文件后,格式化完文件系统即可启动Hadoop了。

core-site.xml

添加

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>    
</configuration>

hdfs-site.xml

replication设置为1,避免standalone模式时提示文件复制出错(默认情况下,文件需要存放三份)。

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>    
        <name>dfs.namenode.name.dir</name>    
        <value>file:///D:/hadoop/data/dfs/namenode</value>    
    </property>    
    <property>    
        <name>dfs.datanode.data.dir</name>    
        <value>file:///D:/hadoop/data/dfs/datanode</value>  
    </property>
</configuration>

mapred-site.xml

将mapred-site.xml.template重命名为mapred-site.xml,然后添加(以使用yarn管理资源为例)

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

yarn-site.xml

添加

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
        <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
</configuration>

常用端口说明

参数说明默认值配置文件示例
fs.default.name namenodenamenode RPC交互端口8020core-site.xmlhdfs://master:8020/
dfs.http.addressNameNode web管理端口50070hdfs- site.xml0.0.0.0:50070
dfs.datanode.addressdatanode 控制端口50010hdfs- site.xml0.0.0.0:50010
dfs.datanode.ipc.addressdatanode的RPC服务器地址和端口50020hdfs- site.xml0.0.0.0:50020
dfs.datanode.http.addressdatanode的HTTP服务器和端口50075hdfs- site.xml0.0.0.0:50075

出错处理

JAVA_HOME带空格

Hadoop在处理带有空格的Java路径时,会存在问题。若Java安装在带空格的目录下,需修改libexec\hadoop-config.cmd文件:

  • %JAVA_HOME%\bin\java.exe加上双引号 "%JAVA_HOME%\bin\java.exe"
  • set JAVA=%JAVA_HOME%\bin\java加上双引号set JAVA="%JAVA_HOME%\bin\java"
  • for循环中增加usebackq选项:for /f "usebackq delims=" %%A in ('%JAVA% -Xmx32m %HADOOP_JAVA_PLATFORM_OPTS% -classpath "%CLASSPATH%" org.apache.hadoop.util.PlatformName') do set JAVA_PLATFORM=%%A

启动出错

通过start-all启动Hadoop时,若报找不到文件:

  • 设置环境变量HADOOP_BIN_PATH为Hadoop的bin目录;
  • 修改start-dfs.cmd和start-yarn.cmd两个批处理文件,在start hadoop **start yarn **前设定当前目录为HADOOP_BIN_PATH(即添加cd /d %HADOOP_BIN_PATH%)。

停止出错

通过Stop-all停止Hadoop时,若提示找不到活动的任务,则说明TaskKill杀进程时未找到对应的运行程序(通过查找窗口标题):

  • 修改stop-dfs.cmd和stop-yarn.cmd中的TaskKill /FI "WINDOWTITLE eq **"(把要查找的标题,修改为真实的命令行窗口标题即可)。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值