HBase读写流程详解

最新推荐文章于 2023-03-04 09:49:45 发布

大数据老人家i

最新推荐文章于 2023-03-04 09:49:45 发布

阅读量266

点赞数 1

分类专栏： HBase

本文链接：https://blog.csdn.net/zh2475855601/article/details/113784106

版权

10 篇文章 0 订阅

订阅专栏

读数据流程

在这里插入图片描述
获取元数据：

找到对应的Region：

读取数据：

在这里插入图片描述

1-4点与读数据流程是类似的：

获取元数据：

找到对应的Region：

根据namespace、表名，再根据rowkey是否匹配某个Region的startkey、endkey，获取对应的RegionServer、Region位置信息
找到对应的RegionServer、Region

写入数据：

一阶段合并：每当一个MenStore写满后，都会溢写到HFile中，要知道小文件会对HDFS文件系统造成巨大的压力，所有需要将这些小的HFile合并成大一点的StoreFile
二阶段合并：将这些大一点的StoreFile合并成一个StoreFile

补充：In-memory合并
在这里插入图片描述

在HBase2.0后加入 In memory compaction
与MemStore的区别：实现了在内存中进行compaction（合并）
In memory compaction主要是延迟Flush到磁盘的时间，尽量优先写入到内存中，有一系列的合并优化操作
数据都是以segment(段)来保存的，首先数据会写到active segment，active segment写完后会将segment合并到pipeline里面，合并pipeline之后会有一定的策略：
1. basic：只管存、合并、不会优化重复数据
2.eager：会将一些重复的数据优化
3.adaptive：会根据重复度来进行优化合并
pipeline如果到达一定的阈值，就开始Flush

关注