Hadoop运维那些事

在实际的生产环境运维一个Hadoop集群有一些必须要关注的事情。

1、Namenode的高可靠性

2、节点配置与管理

3、Mapreduce的内存配置

4、启用trash


首要的是保证数据安全可靠,其次再去考虑存储效率、计算效率、运维效率的优化与提高,当你觉得Hadoop集群的性能太差太差的时候,其实是你对Hadoop的了解太少,Hadoop的效率没有被发挥出来。

数据的可靠性,可以通过高可用、高可靠的NameNode,以及具体数据多副本来实现。启用Trash可以让你在误删除数据之后快要绝望的时候给你反悔的机会,这个一定要启动的,就算你设置的时间短一点都没有关系,后悔药就靠它了。

节点的配置就太多了,最为重要当属不同配置的机器要有自己个性化的配置了,尤其是内存的配置最为重要。


参考文献:

http://www.cloudera.com/blog/2009/12/7-tips-for-improving-mapreduce-performance/

MapReduce: 提高MapReduce性能的七点建议[译] 

Hadoop学习总结之五:Hadoop的运行痕迹 

Hadoop管理员的十个最佳实践

Hadoop平台优化综述(一)

Hadoop维护管理

hadoop集群管理之 Namenode恢复

hadoop集群管理之 添加节点datanode

hadoop集群管理之 删除节点

hadoop集群管理之 Hadoop回收站trash

2012华东运维技术大会的资料--hadoop运维经验分享

Hadoop-0.20.2 作业内存控制策略

Hadoop-0.21.0公平调度器算法分析

Apache hadoop的mail list

Cloudera CDH google group

http://wiki.apache.org/hadoop/





  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值