一、Hadoop守护进程的配置环境
管理员可使用etc/hadoop/hadoop-env.sh脚本定制Hadoop守护进程的站点特有环境变量;另外可选用的脚本还有etc/hadoop/mapred-env.sh和etc/hadoop/yarn-env.sh两个。
通常用于配置各守护进程jvm 配置参数的环境变量有如下几个:
HADOOP_NAMENODE_OPTS∶配置NameNode;
HADOOP_DATANODE_OPTS∶配置 DataNode;
HADOOP_SECONDARYNAMENODE_OPTS∶配置 Secondary NameNode;
YARN_RESOURCEMANAGER_OPTS∶配置ResourceManager;
YARN_NODEMANAGER_OPTS∶ 配置NodeManager;
YARN_PROXYSERVER_OPTS∶配置 WebAppProxy∶
HADOOP_JOB_HISTORYSERVER_OPTS∶配置Map Reduce Job History Server;
HADOOP_PID_DIR∶守护进程PID文件的存储目录;
HADOOP LOG DIR∶守护进程日志文件的存储目录;
HADOOP_HEAPSIZE/YARN_HEAPSIZE∶堆内存可使用的内存空间上限,默认为1000;
例如,如果需要为NameNode使用parallelGC,可在hadoop-env.sh文件中使用如下语句∶
export HADOOP_NAMENODE_OPTS="-XX:+UseParallelGC"
配置Hadoop Daemons时用的关键性参数: