HBase
文章平均质量分 75
大大大大肉包
一个喜欢计算机的帅小伙
展开
-
HBase的Region Split详解
region split是hbases随着数据的不断写入,将一个region切分为两个小region,并将切分后的,以达到将到其他节点。原创 2022-12-09 15:45:19 · 996 阅读 · 0 评论 -
HBase中的Compaction详解
由于memstore每次刷写都会生成一个新的HFile,且同一个字段的不同版本(timestamp)和不同类型(Put/Delete)有可能会分布在不同的 HFile 中,因此查询时需要遍历所有的 HFile。为了,以及,会进行 StoreFile Compaction。原创 2022-12-09 15:17:47 · 1219 阅读 · 0 评论 -
HBase的读写流程
将合并后的最终结果返回给客户端。:HBase上 RegionServer 的内存分为两个部分,一部分作为;另外一部分作为;原创 2022-12-08 17:20:49 · 567 阅读 · 0 评论 -
HBase的数据模型和存储原理
类似于关系型数据库的 DatabBase 概念,每个命名空间下有多个表。HBase有两个自带的命名空间,分别是 hbase 和 default,hbase 中存放的是 HBase 内置的表,default 表是用户默认使用的命名空间。类似于一个表的子表,表中的一部分。HBase中的一个表被拆分成多个region。HBase 定义表时只需要声明列族即不需要声明具体的列。这意味着,往 HBase 写入数据时,字段可以动态、按需指定。因此,和关系型数据库相比,HBase 能够轻松应对字段变更的场景。Rowkey的原创 2022-12-08 17:03:42 · 2302 阅读 · 0 评论 -
HBase的基础介绍
HBase 是 BigTable 的开源(源码使用 Java 编写)版本。是 Apache Hadoop 的数据库,是建立在 HDFS 之上,被设计用来提供高可靠性、高性能、列存储、可伸缩、多版本的 NoSQL 的分布式数据存储系统,实现对大型数据的实时、随机的读写访问。hbase与hive都是架构在hadoop之上的,都是用HDFS作为底层存储。批量读取吞吐量远不如 HDFS,不适用于批量数据分析的场景。原创 2022-12-03 22:18:00 · 920 阅读 · 0 评论