先看官方文档的总体描述:
hbase有两种获得connection的方法,分别是如下两种:
Connection connection = ConnectionFactory.createConnection(conf);
Connection connection = HConnectionManager.createConnection(conf);
这两种方法还有重载方法,在重载方法里可以传递两个参数,第二个参数ExecutorService,这个参数可以覆盖掉默认的线程池,具体的使用方式如下:
不过上述两种方法最终殊途同归,调用的方法都是如下所示的方法:
至于这里的参数managed,该参数用于connection的生命周期管理,在上述的传递过程中该参数始终为false,关于该参数的作用,可以在connection close的时候,看到:
具体的各种close的含义,这里先不做解释。
获得connection之后,如何从里面获取table呢,它调用的是connection的getTable方法,方法定义如下:
进入这个类的getBatchPool()方法:
可以看到Table的获得是从该connection的连接池中获得的,至于连接池的大小在“hbase.hconnection.threads.max”中定义。
至此,我们可以做一个总结,就是说一个应用(进程)对应着一个connection,每个应用里的线程通过调用coonection的getTable方法从connection维护的线程池里获得table实例,按官方的说法,这种方式获得的table是线程安全的。每次table读写之后应该把table close掉,整个进程结束的时候才把connection close掉。