HBase初探

最新推荐文章于 2024-09-19 21:01:53 发布

我小叮当无可奈何

最新推荐文章于 2024-09-19 21:01:53 发布

阅读量228

点赞数

分类专栏： springboot项目 Hbase 文章标签： hbase

本文链接：https://blog.csdn.net/qq_33407429/article/details/106997569

版权

23 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

HBase

最近打算用Hbase存储kafka消息队列的消息内容，防止消息丢失，方便后期补偿作用。

HBase是Hadoop DataBase的简写，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统/数据引擎，组成如下：

偷大佬得概念图
在这里插入图片描述

名词解释
NameSpace：命名空间
Region:区域
Store：存储
Rowkey：数据唯一key
Column Family：列族
Column Qualifier：列
TimeStamp：时间戳
Cell：唯一确认的单元
HBase数据逻辑存放示意图
HBase数据物理存储形式
例：rowkey为rowkey_01的数据存储形式，其中每一行都是Cell(唯一确定单元)
HBase数据中如何确定一行数据？
HBase中确认一行数据的方式为 Rowkey+Column Famliy+Column +Timestamp
HBase数据修改/新增的方式？怎样获取最新的数据？

HBase中进行增删改，都会新增一条记录，并且每次取值的时候都会取出TimeStamp最靠近现在时间的那一条记录
HBase与MySql的类似对比，方便理解：

zookeeper

Hmaster

region server

**region **

hbase中分布式存储和负载均衡得最小单元
region有两个重要属性就是StartKey和EndKey。表示这个Region维护的rowkey的范围

整体流程:
服务端->zk->master->region server(java中的一个进程)->hlog->memory store->store file->hfile->HDFS

/put/table/rowkey/column family/column
在这里插入图片描述
注：

Client访问Zookeeper，查找-ROOT-表，获取.META.表信息；
从.META.表查找，获取存放目标数据的Region信息，从而找到对应的RegionServer；
通过RegionServer获取需要查找的数据；
RegionServer的内存分为MemStore和BlockCache两部分，MemStore主要用于写数据，BlockCache主要用于读数据。读请求先到MemStore中查数据，查不到就到BlockCache中查，再查不到就会到StoreFile上读，并把读的结果放入BlockCache。