HBase的特点和体系架构

1、HBase能做什么
a、海量数据的存储 b、准实时查询

2、HBase业务场景
a、交通 b、金融 c、电商 d、移动 等

3、HBase特点
a、容量大 b、面向列 c、多版本
d、稀疏性 e、扩展性 f、高可靠性 g、高性能(LSM数据结构)

4、如何选择合适的版本
考虑因素:稳定性
a、官网版本 b、CDH版本

5、HBase在Hadoop生态系统的定位:
在这里插入图片描述
6、HBase体系架构:
两个主要进程 : Master RegisonServer
依赖两个外部服务 : Zookeeper HDFS
在这里插入图片描述
7、HBase设计模型
a、列簇 b、Rowkey
在这里插入图片描述
列簇不应该超过5个
每个列簇的列没有限制
列只有植入数据后才存在
列在列簇中是有序的

HBase与关系型数据库的对比:
列动态增加
数据自动切分
高并发读写
不支持条件查询(关系型数据库支持)

8、HBase分布式配置
a、修改HBase.env.sh HBASE_MANAGERS_ZK=false
b、修改hbase-site.xml
c、配置regionServer

HBase的启动命令:
hbase-daemon.sh hbase-daemons.sh
start-hbase.sh stop-hbase.sh

HBase命令:
Create Enable Describe is_disable is_enabled Disable
Drop List Count Put Delete Scan get truncate

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HBase是一个基于Hadoop的分布式、面向列的数据库。它采用了一种分布式存储架构,可以支持海量数据的存储和高并发的访问。 HBase的分布式存储架构主要由HMaster、RegionServer和ZooKeeper组成。HMaster是HBase的主控节点,负责对整个集群进行管理和协调。它负责分配RegionServer和表的负载均衡,并监控RegionServer的状态。 RegionServer是实际存储数据的节点,每个RegionServer负责一定范围的数据区域(Region)。Region按照表的列族进行分割存储,并自动进行数据的划分和迁移,以实现数据的平衡和高可用性。每个RegionServer可以同时服务多个客户端请求,并对数据进行读写操作。 ZooKeeper是分布式协调服务,它主要用于管理和监控整个HBase集群的状态、配置信息和元数据。ZooKeeper负责维护HBase集群的一致性和可用性,通过选主机制确保HMaster的高可用性,同时协调各个RegionServer之间的通信和同步。 在HBase的分布式存储架构中,数据存储在HDFS(Hadoop分布式文件系统)上,并进行分散和冗余存储,以提高系统的可靠性和容错性。HBase采用了列存储的方式,可以支持多维度的扫描和快速的随机读写操作,适用于大数据量和高并发的场景。 总结来说,HBase的分布式存储架构是基于Hadoop的、面向列的数据库系统。它通过HMaster、RegionServer和ZooKeeper等组件,实现了数据的分布式存储、负载均衡和高可用性。这种架构可以支持海量数据的存储和高并发的访问,适用于大规模数据处理和分析的场景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值