HBase读取数据的过程

本文介绍了Cloudera Impala如何为存储在Apache Hadoop中的数据提供交互式SQL查询,并详细解析了HBase的读写过程及其内部机制,如MemCache和BlockCache的作用,为后续的性能优化提供了方向。
摘要由CSDN通过智能技术生成
Cloudera Impala对你存储在Apache Hadoop在HDFS,HBase的数据提供直接查询互动的SQL。除了像Hive使用相同的统一存储平台,Impala也使用相同的元数据,SQL语法(Hive SQL),ODBC驱动程序和用户界面(Hue Beeswax)。Impala还提供了一个熟悉的面向批量或实时查询和统一平台。

搞清楚了HBase的读写过程,便于将来做优化。

读取数据的时候,先从MemCache中读取,MemCache存放的是刚刚写入的数据,如果MemCache中没有,就从BlockCahce中读,
BlockCache中包括一个个HFile,一个HFlie可以理解成一个Block, Block里面存放着数据和索引,这样可以加快检索的速度,如果BlockCache中也没有的话,就从hdfs中读取。

MemCache和BlockCache都在内存中存在,他们有啥区别呢?
MemCache:方便最先插入的被查询
BlockCache:为了查询
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值