HBase中LSM的思想

最新推荐文章于 2024-04-06 00:36:52 发布

YQlakers

最新推荐文章于 2024-04-06 00:36:52 发布

阅读量818

点赞数

分类专栏： HBase

HBase 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

我们首先介绍一下B+树： Oracle的普通索引就是采用B+树的方式；

根节点和枝节点很简单，分别记录每个叶子节点的最小值，并用一个指针指向叶子节点。

叶子节点里每个键值都指向真正的数据块（如Oracle里的RowID），每个叶子节点都有前指针和后指针，这是为了做范围查询时，叶子节点间可以直接跳转，从而避免再去回溯至枝和跟节点。

B+树最大的性能问题是会产生大量的随机IO，随着新数据的插入，叶子节点会慢慢分裂，逻辑上连续的叶子节点在物理上往往不连续，甚至分离的很远，但做范围查询时，会产生大量读随机IO。

对于大量的随机写也一样，举一个插入key跨度很大的例子，如7->1000->3->2000 ... 新插入的数据存储在磁盘上相隔很远，会产生大量的随机写IO.

从上面可以看出，低下的磁盘寻道速度严重影响性能（近些年来，磁盘寻道速度的发展几乎处于停滞的状态）。

下面我们介绍LSM树：

为了克服B+树的弱点，HBase引入了LSM树的概念，即Log-Structured Merge-Trees。

为了更好的说明LSM树的原理，下面举个比较极端的例子：

现在假设有1000个节点的随机key，对于磁盘来说，肯定是把这1000个节点顺序写入磁盘最快，但是这样一来，读就悲剧了，因为key在磁盘中完全无序，每次读取都要全扫描；

那么，为了让读性能尽量高，数据在磁盘中必须得有序，这就是B+树的原理，但是写就悲剧了，因为会产生大量的随机IO，磁盘寻道速度跟不上。

LSM树本质上就是在读写之间取得平衡，和B+树相比，它牺牲了部分读性能，用来大幅提高写性能。

它的原理是把一颗大树拆分成N棵小树，它首先写入到内存中（内存没有寻道速度的问题，随机写的性能得到大幅提升），在内存中构建一颗有序小树，随着小树越来越大，内存的小树会flush到磁盘上。当读时，由于不知道数据在哪棵小树上，因此必须遍历所有的小树，但在每颗小树内部数据是有序的。

以上就是LSM树最本质的原理，有了原理，再看具体的技术就很简单了。

1）首先说说为什么要有WAL（Write Ahead Log），很简单，因为数据是先写到内存中，如果断电，内存中的数据会丢失，因此为了保护内存中的数据，需要在磁盘上先记录logfile，当内存中的数据flush到磁盘上时，就可以抛弃相应的Logfile。

2）什么是memstore, storefile？很简单，上面说过，LSM树就是一堆小树，在内存中的小树即memstore，每次flush，内存中的memstore变成磁盘上一个新的storefile。

3）为什么会有compact？很简单，随着小树越来越多，读的性能会越来越差，因此需要在适当的时候，对磁盘中的小树进行merge，多棵小树变成一颗大树。

转自：http://blog.csdn.net/nuisthou/article/details/49250435

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

YQlakers CSDN认证博客专家 CSDN认证企业博客

码龄10年

37: 原创

18万+: 周排名

46万+: 总排名

22万+: 访问

: 等级

2412: 积分

33: 粉丝

54: 获赞

10: 评论

159: 收藏

私信

关注

热门文章

分类专栏

数据挖掘 2篇
python 1篇
python爬虫 1篇
java 20篇
Offer 5篇
TCP握手 2篇
Linux 4篇
JVM 1篇
Hadoop 9篇
java open
java opencsv 1篇
Mahout 2篇
Mysql 4篇
Hive 3篇
Zookeeper 3篇
Sqoop 1篇
Spark 11篇
kafka 2篇
机器学习 2篇
算法
数据结构 1篇
网络协议 2篇
HBase 2篇

最新评论

Hive与传统数据库的区别
亚楠18012043: 更新、事务和索引都是传统数据库最重要的特性，但是，直到最近，Hive也没有考虑支持这些特性 --对我有用，感谢作者的分享
Java的内存回收机制详解
时光无声_l: 感谢博主的分享，这是我看了这么多资料一来，最能理解的一篇
hadoop上的两种运行mapreduce程序的方法
YQlakers 回复氟化氢-xurb: 你先把平台搭起来再说分析的问题，这个工具并不难主要是你的分析部分算法但是我觉得你们老师让你分析的数据也不会太大用python或者java程序都能解决
hadoop上的两种运行mapreduce程序的方法
氟化氢-xurb 回复 YQlakers: 我现在有一大堆数据要分析，是我老师给我的，他建议我用Hadoop的MapReduce来统计分析，但我不是计算机专业的学生呀，所以我来csdnh找大牛，现在有点崩，嘿嘿嘿
hadoop上的两种运行mapreduce程序的方法
YQlakers: 你直接在这里描述你的问题哈可能不一定能解答你的疑惑我已经丢了一年了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。