1.整合操作
hive整合hbase实际上是为用户提供一种sqlOnHbase的方法。Hive和HBase通过接口互通,用户可以方便地通过SQL接口进行建表、映射表、查询、删除等操作。由于对于hiveOnHbase表的查询走MR框架,因此查询效率较为缓慢需酌情使用。
在非CM管理的CDH集群进行整合时需以下几步:1.拷贝hbase相关jar包、 2.修改配置文件、 3.重启hive服务
1> 修改hive配置
2> 更新过期配置
3> 重启相关服务
2.内部表
在hive中建立hbase的内部映射表,会同时在hive和hbase两端都执行建表操作,要求hbase端的表事先不存在。hive端执行表删除操作时,hbase对应的表也会被删除。
1> hive中建表
hive建表时定义hbase对应表名为HIVEIN2HBASE,其包含一个列族0和两个列PARENTID、DEPARTMENTID
CREATE TABLE test.hivein2hbase
(key string,
parentid string,
departmentid string)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,0:PARENTI