hadoop配置参数

一、各个组件jvm参数
1、在hadoop-env.sh中的HADOOP_HEAPSIZE和HADOOP_CLIENT_OPTS是公共参数,不仅影响namenode/datanode,还会覆盖hive的hive-env.sh中的jvm的设置,因此建议将这两个参数注释
2、设置NameNode的jvm参数,在hadoop-env.sh中设定HADOOP_NAMENODE_OPTS
3、设置DataNode的jvm参数,在hadoop-env.sh中设定HADOOP_DATANODE_OPTS
4、设置ResourceManager的jvm参数,在yarn-env.sh设定YARN_RESOURCEMANAGER_HEAPSIZE和YARN_RESOURCEMANAGER_OPTS
5、设置NodeManager的jvm参数,在yarn-env.sh设定YARN_NODEMANAGER_HEAPSIZE和YARN_NODEMANAGER_OPTS

二、core-site.xml
<property>
    <name>hadoop.tmp.dir</name>
    <value>file:/data/hadoop/tmp</value>
    <description>hadoop相关进程的临时目录。比如SecondaryNameNode在合并edit logs;NodeManger shuffle write的中间数据</description>
</property>

三、hdfs-site.xml
<property>
    <name>dfs.namenode.name.dir</name>
    <value>file:/data/hadoop/dfs/name</value>
    <description>NameNode存放数据的路径</description>
</property>
<property>
    <name>dfs.datanode.data.dir</name>
    <value>file:/data/hadoop/dfs/data</value>
    <description>DataNode存放数据的路径,多个路径逗号分隔</description>
</property>

四、yarn-site.xml
<property>
    <name>yarn.nodemanager.local-dirs</name>
    <value>/data/hadoop/tmp/nm-local-dir</value>
    <description>nodemanager存放数据(如shuffle数据)的路径,多个路径用逗号分隔,</description>
</property>


五、hadoop-env.sh
export HADOOP_LOG_DIR=/data/hadoop/logs :NameNode、DataNode、SecondaryNameNode的日志路径
export HADOOP_CONF_DIR :hadoop配置文件路径,默认是$HADOOP_HOME/etc/hadoop

六、yarn-env.sh
export YARN_LOG_DIR=/data/hadoop/logs :ResourceManager、NodeManager的日志路径

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值