HBase基本概念(一)

HBase是Apache Hadoop生态中的非关系型数据库,依赖HDFS进行存储。它以列族为基础,适用于大数据的读写,并提供松散的数据结构,允许动态增加属性,但不支持事务。HBase与Bigtable类似,具有高度灵活性,常用于大型项目,降低设计和升级成本。
摘要由CSDN通过智能技术生成

HBase的基本定义

HBase是Apache Hadoop中的一个子项目,HBase依托于Hadoop的HDFS作为最基本存储基础单元,通过使用Hadoop的dfs工具就可以看到这些数据。存储文件夹的结构,还可以通过Map/Reduce的框架(算法)对HBase进行操作。

HB使用场景

HBase 不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库.所谓非结构化数据存储就是说HBase是基于列的而不是基于行的模式,这样方面读写你的大数据内容。

HBase是介于Map Entry(key & value)和DB Row之间的一种数据存储方式。就点有点类似于现在流行的Memcache,但不仅仅是简单的一个key对应一个 value,你很可能需要存储多个属性的数据结构,但没有传统数据库表中那么多的关联关系,这就是所谓的松散数据。

简单来说,你在HBase中的表创建的可以看做是一张很大的表,而这个表的属性可以根据需求去动态增加,在HBase中没有表与表之间关联查询。你只需要 告诉你的数据存储到Hbase的那个column families 就可以了,不需要指定它的具体类型:char,varchar,int,tinyint,text等等。但是你需要注意HBase中不包含事务此类的功 能。

Apache HBase 和Google Bigtable 有非常相似的地方,一个数据行拥有一个可选择的键和任意数量的列。表是疏松的存储的,因此用户可以给行定义各种不同的列,对于这样的功能在大项目中非常实用,可以简化设计和升级的成本。

Hbase与Hadoop的关系

1.HDFS为HBase提供高可靠底层存储支持

2.MapReduce为HBase提供高性能计算能力

3.HBase架构

HBase核心功能模块
Client-RPC
  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HBase是一个基于Hadoop的分布式列式数据库,它是Google的Bigtable的开源实现。HBase支持非常大的表,可以处理数十亿行、百万列的数据。它提供了高可用性、高性能的访问和线性可扩展性,可以在数千个节点上运行。 基本概念: 1. 表:HBase中的表类似于关系数据库中的表,但不同之处在于,HBase表是稀疏的,只存储实际存在的数据。 2. 行:HBase表中的每一行都有一个唯一的行键,行键必须是可比较的,并且按照字典序存储。 3. 列族:HBase表中的列被组织成列族。每个列族都包含一组相关的列,并且在表创建时必须指定。 4. 列:HBase表中的列是动态的,可以在任何时候添加新的列。每个列都有一个唯一的列限定符。 工作原理: HBase使用Hadoop的HDFS文件系统来存储数据,并且使用ZooKeeper来进行协调。HBase集群由一个或多个RegionServer和一个或多个HMaster组成。HMaster负责管理整个集群,包括表的创建和删除、RegionServer的管理和负载均衡。RegionServer负责管理表的Region,每个Region维护一部分行的数据。当表的数据量增加时,Region会自动水平切分成多个Region,这些Region会分散到不同的RegionServer上进行管理,这样就实现了HBase的线性可扩展性。 当客户端请求读取或写入数据时,它会首先向HMaster发送请求,HMaster会根据表的元数据信息确定该请求应该由哪个RegionServer处理。然后客户端会直接与对应的RegionServer进行通信,RegionServer会根据请求的行键来定位数据所在的Region,并返回结果给客户端。如果需要写入数据,RegionServer会将数据写入内存中,并定期刷盘。如果内存中的数据达到一定的阈值,RegionServer会将其写入HDFS中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值