hive整合hbase

hive整合可能有很多版本不一样,但是hive的版本一定要能支持整合hbase,hive-0.6.0以前的版本不支持,之后的版本才支持整合hbase。

1.hive和hbase都独立安装成功,都能正常运行。

2.hadoop1.x查看hive/lib下有没有包hbase-0.90.5.jar和zookeeper-3.3.2.jar,没有的话则从hbase的lib包下拷贝过去,如果版本不一样,则替换成hbase下的版本。

hadoop2.x查看hive/lib下有没有包hbase-client-0.98.1-cdh5.1.0.jar,hbase-common-0.98.1-cdh5.1.0.jar,hive-hbase-handler-0.12.0-cdh5.1.0.jar,zookeeper-3.4.5-cdh5.1.0.jar,hbase-server-0.98.1-cdh5.1.0.jar,hbase-common-0.98.0-hadoop2-tests.jar,hbase-protocol-0.98.0-hadoop2.jar,htrace-core-2.04.jar等包,没有的话则从hbase的lib包下拷贝过去。

注意第三步添加路径时需添加第二步所有的jar包!!

3.查看hive/conf/hive-site.xml有没有配hive.aux.jars.path属性,添加包以第二步的包为准,值应该类似如下,你也可以去hive-env.sh中的HIVE.AUX.JARS.PATH里配置:

<property>  
  <name>hive.aux.jars.path</name>   
  <value>file:///usr/local/hive/lib/hive-hbase-handler-0.8.0.jar,file:///usr/local/hive/lib/hbase-0.90.5.jar,file:///usr/local/hive/lib/zookeeper-3.3.2.jar,file:///usr/local/hive/lib/hbase-server-0.98.1-cdh5.1.0.jar,file:///usr/local/hive/lib/hbase-common-0.98.1-cdh5.1.0-tests.jar,file:///usr/local/hive/lib/hbase-protocol-0.98.1-cdh5.1.0.jar,file:///usr/local/hive/lib/htrace-core-2.04.jar</value>
</property>

如果在执行hql的task时提示类不存在,则应该在此属性中加上对应的包,具体参考当hive和hbase整合之后,执行hql,提示找不到类。 hive引入jar包--HIVE.AUX.JARS.PATH和hive.aux.jars.path

如果在hive-site.xml中没有配置路径,则可以在启动hive时,设置路径:hive --auxpath /usr/local/hive/lib/hive-hbase-handler-0.8.0.jar, /usr/local/hive/lib/hbase-0.90.5.jar, /usr/local/hive/lib/zookeeper-3.3.2.jar。

4.配置hive.zookeeper.quorum和hive.zookeeper.quorum,内容为hbase的zookeeper。

<property>
  <name>hive.zookeeper.quorum</name>
  <value>node1,node2,node3</value>
  <description>The list of zookeeper servers to talk to. This is only needed for read/write locks.</description>
</property>

<property>
  <name>hbase.zookeeper.quorum</name>
  <value>node1,node2,node3</value>
  <description>The list of zookeeper servers to talk to. This is only needed for read/write locks.</description>
</property>

hbase.zookeeper.quorum属性在hive-site.xml中没有,需加上,如果这里不配置,那么联合hbase启动时,需要加上 --hiveconf hbase.master=master:60000,才能联合hbase成功。

这里不需要指定zookeeper的端口,因为hive-site.xml还有一个属性hive.zookeeper.client.port来专门指定zookeeper的端口。

5.进入hive shell,运行命令:hive。hive和hbase整合步骤即完成了。也可以使用命令:hive --hiveconf hbase.master=master:60000,但是hbase.zookeeper.quorum已经配置了hbase部分内容,所以可以不加 --hiveconf hbase.master=master:60000,他们都是用来确定hbase master的。

6.测试,在hive cli中运行如下命令建表,再到hbase中查看xyz表是否已经存在,存在则整合成功。

CREATE TABLE hbase_table_1(key int, value string) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,cf1:val") TBLPROPERTIES ("hbase.table.name" = "xyz");

hbase.table.name 定义在hbase的table名称 ,hbase.columns.mapping 定义在hbase的列族。

参考:

Hadoop Hive与Hbase关系 整合

Hive HBase Integration

转载于:https://my.oschina.net/cjun/blog/483298

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在Hadoop生态系统中,Hive是一个用于数据仓库和数据分析的开源工具,而HBase是一个开源的、分布式的、非关系型数据库。在某些情况下,因为版本不兼容或者依赖关系错误,可能会发生Hive整合HBase时出现IncompatibleClassChangeError(不兼容的类变更错误)。 IncompatibleClassChangeError是Java虚拟机(JVM)在运行期间抛出的错误,它表示在编译时使用的类与运行时使用的类发生了不兼容的变化。当Hive试图整合HBase时,如果Hive代码使用了HBase中的类,但实际运行时使用的HBase库与Hive编译时使用的库不兼容,就会出现这个错误。 解决这个问题的步骤如下: 1. 检查HBaseHive的版本是否兼容。在整合HiveHBase之前,确保使用的HBase版本与Hive版本兼容,并遵循它们之间的兼容性要求。 2. 检查依赖关系。在使用Hive整合HBase时,确保在Hive配置文件(hive-site.xml)中正确地设置了HBase相关的依赖。这包括指定HBase的主机名、端口号和表名等。 3. 检查类路径。确保在Hive运行期间正确配置了HBase的类路径,以便可以找到所需的HBase类。这可以通过检查HiveHBase的环境变量设置或者Hive的启动脚本来完成。 4. 更新HiveHBase的库。如果以上步骤都没有解决问题,可能需要升级HiveHBase的库版本,以确保它们之间的兼容性。 综上所述,Hive整合HBase时出现IncompatibleClassChangeError错误可能是由于版本不兼容或者依赖关系错误导致的。通过检查版本兼容性、依赖关系、类路径和库更新等措施,可以解决这个问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值