Hbase Java Client简介
概述以及架构
我们在使用hbase的时候,数据操作都是和regionserver直接通信操作,hbase的Java客户端将这些操作都封装在HTable类中,对外我们使用的所有操作都是直接使用HTable的api来直接操作,HTable的基本操作如下:
get、get list、put、put list、delete、delete list、append、Increment、checkAnd***、scan 。
hbase client架构图如下:
虚线中的部分是线程安全的,在整个jvm client中可以维持一份来供多线程使用,避免资源的重载,资源重建等耗时操纵。
HTable
Htable是对外的数据操作接口,提供了hbase基本所有的数据操作方法, htable中提供了buffer的功能(BufferedMutator),当buffer达到一定的size或者num后,会自动后台线程flush到相应的regionserver。
目前这个buffer只针对put(put list)操作并且需要关闭自动提交,可以异步提交put请求并并flush,其它操作都是同步完成,有些单个的请求是直接同步发送rpc请求,批量的操作涉及到多个regionserver通信的操作,会分组做成runnable,提交到thread pool并行执行,待所有执行完成后返回。
Htable中目前看除了带buffer的put操作,其它的操作其实还都是线程安全的,因为其它操作基本上没有太多共用的属性,而且操作大头其实都是聚集在connection(regionlocation cache、rpc socket)中,而connection中的操作都是线程安全的。
htable的构造方法如下:
需要connection和相应的配置,可以自定义executorService,也可以直接从connection.getTable(TableName)方法获得,创建这些table其实是没有太多开销的,底层的connection共用,如果executorService为null则共用connection中的executorService,建议这样。
ps:在1.0以前的HTable中会有用configuration 和