Hadoop学习经验分享

Hadoop学习经验分享

书籍和paper 

<Hadoop: The Definitive Guide>: 里面内容非常好,既有高屋建瓴,又有微观把握, 
比如mapreduce各个子阶段,经常问道join在里面也有代码实现, 
google的三量马车,GFS, MapReduce, BigTable 

入门: 
知道MapReduce大致流程,map, shuffle, reduce 
知道combiner, partition作用,设置compression 
搭建hadoop集群,master/slave 都运行那些服务 
HDFS,replica如何定位 
版本0.20.2->0.20.203->0.20.205, 0.21, 0.23, 1.0 
新旧API不同 

进阶: 
Hadoop 参数调优,cluster level: JVM, map/reduce slots, job level: reducer #, 
 memory, use combiner? use compression? 
pig latin, Hive 简单语法 
HBase, zookeeper 搭建 

最新: 
关注cloudera, hortonworks blog 
next generation MR2框架 
高可靠性, namenode: avoid single point of failure 
数据流系统:streaming storm(twitter). 

演练算法: 
wordcount 
terasort 
字典同位词 
翻译sql语句 select count(x) from a group by b; 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值