"Hadoop/MapReduce/HBase"分享总结

概述:

此分享是关于hadoop生态系统的简单介绍包括起源到相对应用

技术点:

1.hadoop核心包括Common,HDFS和MapReduce;
2.Pig,Hbase,Hive,Zookeeper;
3.Hadoop日志分析工具Chukwa;
4.MR解决的问题:海量输入数据,简单任务划分和集群计算环境;
5.执行流程:FileSplit / Map / Combine(Partition)和Copy / Sort / Reduce 
6.分布式计算包括:作业和任务调度和执行,预测执行,故障处理和针对不同应用环境的优化
7.HDFS可靠性措施:NameNode备份,多数据结点(冗余),数据结点的心跳检测,块报告和完整性检验,NameNode的日志文件和镜像文件;
8.两个系列版本:Apache和Cloudera;
9.SSH无密码访问;
10.内置web服务器:
JobTrackerIP:50030 
TaskTrackerIP:50060 
NamenodeIP:50070 
DatanodeIP:50075 
11.HBase以以Region为单位管理region(startKey,endKey);
12.HBase的每个Column Family单独存储:storeFile;
13.HBase的RegionServer为Region读写操作的场所;
14.HBase的Master管理Region的分配和基于zookeeper来保证HA;
15.HBase的强一致性:同一行数据的读写只在同一台regionserver上进行;
16.HBase的水平伸缩:region的自动分裂以及master的balance,只用增加datanode机器即可增加容量和增加regionserver机器即可增加读写吞吐量;
17.HBase的行事务;
18.HBase三维有序rowKey (ASC) + columnLabel(ASC) + Version (DESC)  --> value 
19.HBase支持范围查询和高性能随机写 ;
20.HBase基于Hadoop;
21.HBase不支持二级索引和join操作;
22.Hbase具有特定的适用场景;

详情参见附件

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值