1. HBase Connector介绍
数据虚拟化引擎openLooKeng中的HBase Connector支持访问Apache HBase集群并进行查询和创建表的操作。用户可以在openLooKeng中创建表,并映射到HBase Cluster中已有的表,支持INSERT、SELECT和DELETE操作。
——
一个简单的全表扫描的sql的执行,会经历哪些阶段:
首先该sql将要访问的数据,一定是属于某一个数据源的,那么一个通用的Connector需要做哪些事情。Sql的解析是由openLooKeng本身完成的;接下来是生成执行计划,在这个阶段需要验证用户所访问的表的合法性,那么Connector则需要提供该功能(即元数据管理);然后就到了任务调度阶段,openLooKeng会将一个大任务划分为多个小任务,由多个worker分工完成,那么Connector会提供split分割的接口,即SplitManager;Worker在收到任务之后,以分片为最小单元进行数据加载,此时需要用到Connector中的PageSource/PageSink来完成数据的读写操作。所以在HBase Connector中我们实现了这些关键模块(SplitManager,HBaseClient,HetuMetastore)。
HBase Cluster的主要组件:ZooKeeper用来记录一些元数据信息,Master用来处理用户发过来的请求,RegionServer用来执行用户请求并管理Region的分裂和合并。