第四讲-hbase的常见面试题和布隆过滤器

大数据学习爱好者

已于 2022-03-13 23:45:40 修改

阅读量2.2k

点赞数 10

分类专栏： kafka hive hbase 文章标签： hbase 数据库 database

于 2022-03-13 23:42:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010160949/article/details/123447767

版权

hbase 同时被 3 个专栏收录

10 篇文章 0 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

布隆过滤器

1.布隆过滤器
2. Hlog和WAL机制
3.hbase 写的快的原因

1.布隆过滤器

它实际上是一个很长的二进制向量和一系列随机
映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。
布隆过滤器判断一个元素不在，肯定不在
判断元素在的话，再数据库在进行查询。
实现原理:
布隆过滤器的实现原理和hash表的数据原理差不多。数据通过hash函数将数据映射到某个地址。如果有冲突会( 拉链法、开放地址法)出处理数据冲突的。
在这里插入图片描述
布隆过滤器主要是

数据通过通过映射函数映射到多个二进制位上。当某个数据映射到多个二进制位有一个不为1，说明不存在。数据通过映射函数判断存在可能有误判。因为数据可能同映射函数处理后相同。

2. Hlog和WAL机制

WAL意为Write Ahead Log,用来做灾难恢复之用。基本原理是在数据写入之前首先顺序写入日志，然后再写入缓存，等到缓存写满之后统一落盘。WAL将一次随机写转化为了一次顺序写加一次内存写。WAL可以保证数据的可靠性，即在任何情况下数据不丢失

3.hbase 写的快的原因

hbase的存储引擎用的是LSM树，LSM核心思想的核心就是放弃部分读能力，换取写入的最大化能力。先将最新的数据驻留在内存中，等到积累到最后多之后，再使用归并排序的方式将内存内的数据合并追加到磁盘队尾。

大数据学习爱好者

关注

10
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
第四讲-hbase的常见面试题和布隆过滤器

布隆过滤器1.布隆过滤器2.1.布隆过滤器它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。布隆过滤器判断一个元素不在，肯定不在判断元素在的话，再数据库在进行查询。实现原理:布隆过滤器的实现原理和hash表的数据原理差不多。数据通过hash函数将数据映射到某个地址。如果有冲突会( 拉链法、开放地址法)出处理数据冲突的。布隆过滤器主要是数据通过通过映射函数映射到多个二进制位上。当某个数据映射到多个二进制位有一个不为1，说明不存在。数据通过
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大数据学习爱好者 你的鼓励是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。