hadoop 优化0

最新推荐文章于 2023-02-09 19:32:33 发布

wangqiaoshi

最新推荐文章于 2023-02-09 19:32:33 发布

阅读量1k

点赞数

分类专栏： hadoop 文章标签： hadoop optimization 内存分配

hadoop 专栏收录该内容

21 篇文章 0 订阅

订阅专栏

1.hadoop-env.sh：该文件用来配置hadoop所需的特殊环境变量：

JAVA与HADOOP环境变量的设置（如果在~/.bash_profile中设置了环境变量，这里可以不进行配置）

export JAVA_HOME=/home/admin/deploy/java6

export HADOOP_HOME=/home/admin/deploy/hadoop-0.20.2

# The maximum amount of heap to use, in MB. Default is 1000.
# export HADOOP_HEAPSIZE=2000

JAVA虚拟机性能调优（省略不用修改的内容）

HADOOP_NAMENODE_OPTS="-Xmx2048m–Xms1024m -Xmn1024m

HADOOP_DATANODE_OPTS="-Xmx2048m–Xms1024m -Xmn1024m

HADOOP_JOBTRACKER_OPTS="-Xmx2048m–Xms1024m -Xmn1024m

补充解释：

HADOOP_HEAPSIZE 这个参数是每一个守护线程分配多少内存，因为namenode 把数据放到内存，所以会造成较大的内存开销，所以一般要单独为namenode配置内存使用 HADOOP_NAMENODE_OPTS 参数。

这里的XMS与XMX指的是JAVA虚拟机内存分配策略中的最大可用内存和最小内存设置。

不建议将XMS与XMX设置成一样。因为java的垃圾回收器在内存使用达到XMS值的时候才会开始回收，如果2个值一样，那么JAVA会在使用完所有内存时才会回收垃圾，导致内存LOAD一直很高。

关于XMN这个参数是JAVA内存机制中的年轻代。

整个JVM内存大小=年轻代大小 + 年老代大小 + 持久代大小。

持久代一般固定大小为64m，所以增大年轻代后，将会减小年老代大小。此值对系统性能影响较大，Sun官方推荐配置为整个堆的3/8。这里为了便于计算，取整个堆的一半。

另外：如果JAVA内存设置过大，HADOOP启动会报错

Error occurred during initialization of VM，Could not reserve enough space for object heap

2.内存、任务数与cpu个数的关系。

在mapred-site.xml配置文件中设置

mapred.tasktracker.map.tasks.maximum 默认2 每个tasktracker 最多运行的tasks数目

mapred.tasktracker.reduce.tasks.maximum 默认2 每个tasktracker最多运行的reduce数目

mapred.child.java.opts 默认-Xmx200m 每个任务分配多少内存

那么如下表：

如果HADOOP_HEAPSIZE 取默认值，那么datanode tasktracker等守护线程均分别占1000m内存。默认每个tasktracker运行2个map和2个reduce任务。那么总共的内存开销是2800m

那么对于多处理器而言，任务数和cpu数之间的关系，在hadoop权威指南上指出。经验值是：任务数/cpu数目在1~2之间。

比如具有8个cpu的机器，那么总任务数，就不能超过16，因为slave节点上的datanode 和tasktracker 也有进程开销。

原则就是，在考虑分配多少任务数时，要考虑同时运行在这台节点上的其他进程。

可以使用ganglia工具来监控集群的内存信息。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop 优化0

1.hadoop-env.sh：该文件用来配置hadoop所需的特殊环境变量：JAVA与HADOOP环境变量的设置（如果在~/.bash_profile中设置了环境变量，这里可以不进行配置）export JAVA_HOME=/home/admin/deploy/java6export HADOOP_HOME=/home/admin/deploy/hadoop-0.20.
复制链接

扫一扫

专栏目录

wangqiaoshi CSDN认证博客专家 CSDN认证企业博客

码龄14年

149: 原创

18万+: 周排名

183万+: 总排名

16万+: 访问

: 等级

2845: 积分

39: 粉丝

8: 获赞

11: 评论

17: 收藏

私信

关注

热门文章

分类专栏

C++ & Qt 10篇
Java web 10篇
android 9篇
C# & Asp.net & WPF 14篇
javascript 6篇
Mysql & Oracle 7篇
算法 19篇
spring,hibernate,struts 8篇
设计模式 4篇
hadoop 21篇
Linux 23篇
Python 41篇
maven 4篇
machine learn&mahout 8篇
杂记 4篇
hive 4篇
flume 9篇
storm 6篇
hbase 1篇
hibernate

最新评论

TDIDF 自动提取关键词
yzskakashi: 谢谢
Hive读取Flume正在写入的HDFS临时文件所遇到的问题
willgone123: 我现在遇到的问题是从windows下往linux下flume的spooldir路径里上传文件，会报异常java.lang.IllegalStateException: File has been modified since being read: /home/nids/wg/apache-flume-1.5.2-bin/ceshi12/1.txt at org.apache.flume.client.avro.ReliableSpoolingFileEventReader.retireCurrentFile(ReliableSpoolingFileEventReader.java:306) 也就是边上传边通过flume来读写数据到hdfs会出错。在flume。source.type=spooldir下的目录当进来一个较大文件时，这个文件一时半会没读完，而sink已经开始往hdfs写入了，于是就报上面的错.请问楼主有什么好的解决方案没？
flume MemoryChannel 源码解析
yuxin330225: 真犀利
jsp与servlet的区别！
FPGAchuxuezhe: 写得很好
开源版qt连接oracle数据库成功了！
chaumook: 你是怎么出现这个界面的

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。