HBase读取数据的过程

最新推荐文章于 2023-04-12 16:16:18 发布

haveysun

最新推荐文章于 2023-04-12 16:16:18 发布

阅读量1.4k

点赞数

分类专栏： HBase 文章标签： HBase

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haveysun/article/details/43765139

版权

HBase 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文介绍了Cloudera Impala如何为存储在Apache Hadoop中的数据提供交互式SQL查询，并详细解析了HBase的读写过程及其内部机制，如MemCache和BlockCache的作用，为后续的性能优化提供了方向。

摘要由CSDN通过智能技术生成

Cloudera Impala对你存储在Apache Hadoop在HDFS，HBase的数据提供直接查询互动的SQL。除了像Hive使用相同的统一存储平台，Impala也使用相同的元数据，SQL语法（Hive SQL），ODBC驱动程序和用户界面（Hue Beeswax）。Impala还提供了一个熟悉的面向批量或实时查询和统一平台。

搞清楚了HBase的读写过程，便于将来做优化。

读取数据的时候，先从MemCache中读取,MemCache存放的是刚刚写入的数据，如果MemCache中没有，就从BlockCahce中读，

BlockCache中包括一个个HFile,一个HFlie可以理解成一个Block， Block里面存放着数据和索引，这样可以加快检索的速度，如果BlockCache中也没有的话，就从hdfs中读取。

MemCache和BlockCache都在内存中存在，他们有啥区别呢？

MemCache:方便最先插入的被查询

BlockCache:为了查询

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。