Hadoop启动脚本

最新推荐文章于 2022-11-22 23:34:53 发布

yazi-xp

最新推荐文章于 2022-11-22 23:34:53 发布

阅读量426

点赞数

分类专栏： Hadoop

本文链接：https://blog.csdn.net/qq824387335/article/details/53258018

版权

Hadoop 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

*************************************************************************************************************

####参考材料####

Hadoop启动脚本全解析，不能再全了！[bed]:http://blog.csdn.net/mrtitan/article/details/9115621

*************************************************************************************************************

hadoop启动的入口脚本是/etc/init.d/hadoop-hdfs-name，下面我们顺着启动namenode的顺序看看hadoop的启动调用过程。

/etc/init.d/hadoop-hdfs-namenode：
#1.加载/etc/default/hadoop /etc/default/hadoop-hdfs-namenode

#2.执行/usr/lib/hadoop/sbin/hadoop-daemon.sh启动namenode

cloudera启动namenode的用户为hdfs，默认的配置目录是/etc/hadoop/conf

/etc/default/hadoop /etc/default/hadoop-hdfs-namenode：

#1.配置logdir，piddir，user

/usr/lib/hadoop/sbin/hadoop-daemon.sh
#1.加载/usr/lib/hadoop/libexec/hadoop-config.sh

#2.加载hadoop-env.sh

#3.指定log目录

#4.补全log目录和log4j的logger等参数

#5.调用/usr/lib/hadoop-hdfs/bin/hdfs

可以看到namenode的sysout输出到$log中，即log=$HADOOP_LOG_DIR/hadoop-$HADOOP_IDENT_STRING-$command-$HOSTNAME.out

/usr/lib/hadoop/libexec/hadoop-config.sh
#1.加载/usr/lib/hadoop/libexec/hadoop-layout.sh
hadoop-layout.sh主要描述了hadoop的lib的文件夹结构

#2.指定HDFS和YARN的lib

#3.对slave文件判断。但cdh的hadoop不是依靠slave来启动集群的，而是要用户自己写集群启动脚本（也许是为了逼用户用他的CloudManager。。。）

#4.再次指定env文件

#5.指定java home

#6.指定Java程序启动的heapsize，如果用户在hadoop-env.sh中指定了HADOOP_HEAPSIZE字段则会覆盖默认值1000m

#7.指定程序的classpath，一大串代码，总结下就是
HADOOP_CONF_DIR+HADOOP_CLASSPATH+HADOOP_COMMON_DIR+HADOOP_COMMON_LIB_JARS_DIR+
HADOOP_COMMON_LIB_JARS_DIR+HADOOP_COMMON_LIB_NATIVE_DIR+HDFS_DIR+HDFS_LIB_JARS_DIR
+YARN_DIR+YARN_LIB_JARS_DIR+MAPRED_DIR+MAPRED_LIB_JARS_DIR

有一个要注意的，hadoop比较贴心的提供了HADOOP_USER_CLASSPATH_FIRST属性，如何设置了，
则HADOOP_CLASSPATH（用户自定义classpath）会在hadoop自身的jar包前加载，用来解决用户
想最先加载自定义的jar包情况。

#8.指定HADOOP_OPTS，-Dhadoop.log.dir这些类似参数会在conf下的log4j配置中用到

/usr/lib/hadoop-hdfs/bin/hdfs
#1.加载/usr/lib/hadoop/libexec/hdfs-config.sh，但好像没啥作用

#2.根据启动参数指定java的启动mainclass：

最后介绍几个配置的小例子。

1.如何指定hadoop的log目录：

从启动脚本中看几个配置的优先级排序是hadoop-env.sh>hadoop-config.sh>/etc/default/hadoop，因此我们如果想指定hadoop的log目录只需在hadoop-env.sh中添加一行：

export HADOOP_LOG_DIR=xxxxx

2.如何添加自己的jar包到hadoop中被namenode，datanode使用

export HADOOP_CLASSPATH=xxxxx

3.如何单独设定namenode的java heapsize。

比如想设置namenode10G，datanode1G，这个就有点意思了。如果直接指定HADOOP_HEAPSIZE那么此参数会作用于namenode,datanode，而单独在namenode的参数中指定也会有点小问题哦，不过基本是可以使用的。

总之，由于hadoop的启动脚本极其多而且琐碎，再加上hbase hive的启动脚本都是类似的结构，导致在添加修改一些配置时会产生很多莫名的问题，大家也可以在使用的过程中细细体会啦

yazi-xp

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop启动脚本

*************************************************************************************************************####参考材料####Hadoop启动脚本全解析，不能再全了！[bed]:http://blog.csdn.net/qq824387335/article/details/
复制链接

扫一扫

专栏目录