超详细梳理HBase核心知识点（上）

叹了口丶气

已于 2022-05-03 16:35:07 修改

阅读量626

点赞数 2

分类专栏： HBase全方位实战文章标签： hbase hadoop big data

于 2021-09-21 15:32:45 首次发布

本文链接：https://blog.csdn.net/yexiguafu/article/details/120402054

版权

HBase全方位实战专栏收录该内容

9 篇文章 1 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文详细梳理了HBase的核心知识点，包括整体架构、常用Shell命令与API、存储机制等方面。HBase是一个列式存储的分布式数据库，基于HDFS，依赖Zookeeper进行高可用管理。文章介绍了RegionServer、Master、Zookeeper的角色，以及Region的存储结构，强调了WAL和MemStore在数据存储和恢复中的作用。此外，还讨论了数据的写入和读出流程，以及Region的定位方式。

摘要由CSDN通过智能技术生成

这本书正如其名字一样，是一本让人读起来根本不会发困的书，very奈斯。本文就是整理了这本书上的知识点而形成的文章，准备分为上下两篇文章系统梳理HBase核心知识点，如果你想了解HBase，那么这篇文章不会让你失望的，同时推荐阅读一下原书。让我们开始吧。

前言

HBase 是一个开源的、面向列的非关系型分布式数据库，目前是Hadoop体系中非常关键的一部分。
在最初，HBase是基于谷歌的 BigTable 原型实现的，许多技术来自于Fay Chang在2006年所撰写的Google论文"BigTable"。与 BigTable基于Google文件系统（File System）一样，HBase则是基于HDFS(Hadoop的分布式文件系统)之上而开发的。

HBase 采用 Java 语言实现，在其内部实现了BigTable论文提到的一些压缩算法、内存操作和布隆过滤器等，这些能力使得HBase 在海量数据存储、高性能读写场景中得到了大量应用，如 Facebook 在 2010年11 月开始便一直选用 HBase来作为消息平台的存储层技术。
HBase 以 Apache License Version 2.0开源，这是一种对商业应用友好的协议，同时该项目当前也是Apache软件基金会的顶级项目之一。

有什么特性？