Memstore
针对于写操作,数据会先写入memstore ,如果大于某个设定的值则触发Flush的操作,将数据写入磁盘
BlockCache
针对于读,当我们去某张表中去读数据,读出来以后,会把它放到一个缓存里面,以便下次再读取是可以直接取出来,比从文件中拿取快(在hbase 的mapreduce job中一般不用设置缓存,因为mapreduce的操作结束后几乎不会经常用到这些数据scan.setCacheBlocks(false);)
还有一些别的也占用了一些内存
为什么hbase速度很快?
写入数据有一部分还在MemStore,还没有flush到磁盘
读取数据也有一部分重要的常用的数据还在BlockCache里面,还没有flush到磁盘
当我们执行hbase查询任务时,先是去MemStore和BlockCache中查找,这个速度很快
因为是在内存中而不是在磁盘中,然后再去hdfs中查hfile
最后再merge合并数据,返回数据集。
常识:
一个regionserver 只有一个BlockCache,但是有多个Memstore