Hbase读写数据流程

最新推荐文章于 2023-05-08 22:56:14 发布

z小丑八怪r

最新推荐文章于 2023-05-08 22:56:14 发布

阅读量217

点赞数

分类专栏： hbase 大数据文章标签：大数据 hbase

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46959672/article/details/110201859

版权

大数据同时被 2 个专栏收录

18 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

Hbase读写数据流程

前言

学习大数据过程中记下的一些笔记

以下是本篇文章正文内容，下面案例可供参考

行键的重要性 —> 1) 唯一标识 2) 排序 3) 索引 4) 实施布隆过滤器 5) 行级事务

写数据流程

在这里插入图片描述
写数据流程(put为例)

1、客户端请求Zookeeper插入数据put ‘a’,‘rk001’,‘cf:age’,‘21’

2、zookeeper返回客户端元数据在哪个region server

3、客户端请求返回的regionserver下载元数据（为什么要下载，而不是读数据，读数据不是比下载快？因为下载后会将元数据缓存到客户端内存中，下次再有相同需求时直接用缓存的数据操作）

4、客户端下载缓存，解析下载到的元数据，得到region所在的位置（hostname，regionname）

5、请求regionserver写数据，a表->包含rk001的的region->store(cf1)->MemoryStore(128M)

6、边将数据写到内存中，一边向hdfs写日志文件(避免region server宕机，内存中的数据丢失) MemoryStore(默认内存中的数据达到128M刷新一次)->flush刷新->生成多个storefile文件(逻辑上的，不是真正的文件)，一个storefile对应HDFS中一个hfile文件。storefile和hfile可以看成一个东西，storefile是逻辑上的，hfile是物理上的

flush时机：
1、一个MemoryStore达到128M

2、手动刷新

3、机器内存到达阈值，所有的MemoryStore刷新

4、写操作达到一定的次数

读数据流程

在这里插入图片描述

读数据流程(get为例)
1、客户端请求Zookeeper插入数据get ‘a’,‘rk001’

2、zookeeper返回客户端元数据的位置

3、客户端请求返回的region server下载元数据

4、客户端下载缓存，解析下载到的元数据，得到region所在的位置（hostname，regionname）

5、请求region server读数据

1）一个regionserver中只有一个BlockCache, 读取数据的时候先在BlockCache,缓存块中获取数据，找到返回；

2）如果没有在BlockCache获取到数据，再进行内存和Hfile中的检索 ,如果有数据直接返回，当获取到数据以后再将数据写入BlockCache缓存起来，方便下次读取的时候提高效率。在Hfile中查找时，会***布隆过滤器***快速找到并返回。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hbase读写数据流程

Hbase读写数据流程提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Hbase读写数据流程前言写数据流程读数据流程前言学习大数据过程中记下的一些笔记提示：以下是本篇文章正文内容，下面案例可供参考写数据流程写数据流程(put为例)1、客户端请求Zookeeper插入数据put ‘a’,‘rk001’,‘cf:age’,‘21’
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。