HBase数据库面试知识点:第二部分 - 核心技术(持续更新中)

目录

1. 分布式存储与HDFS

2. 面向列的存储

3. 数据版本控制

4. Region与RegionServer

5. 分布式协调服务(ZooKeeper)


1. 分布式存储与HDFS

HBase利用Hadoop的HDFS作为其底层存储系统,确保数据的高可靠性和可扩展性。

  • 数据块(Block)在HDFS中,数据被分割成大小固定(默认为128MB)的数据块,这些数据块被存储在集群的多个节点上。通过数据块的冗余存储(通常为三个副本),HDFS提供了数据容错能力,即使某个节点故障,也能从其他节点恢复数据。

  • NameNode与DataNodeHDFS中,NameNode是集群中的主节点,负责管理文件系统的元数据,如文件名、目录结构、数据块位置等。DataNode则是从节点,负责存储实际的数据块,并根据NameNode的指令进行数据的读写操作。NameNode通过心跳机制与DataNode保持通信,确保集群的健康状态。

  • HBase与HDFS的集成在HBase中,每个表都映射到HDFS上的一个目录。表中的数据被水平划分为多个Region,每个Region对应HDFS中的一个或多个文件。当HBas

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值