之前都是用impala查hive共享的数据,今天测试查了一下hbase的数据,方法很简单,就是hive里建hbase的外部表,用impala查询hive外部表的数据,发现一个问题,相同数据的情况下,查询hbase表数据和hive差别太大,如下图:
同样的数据量:
1、hive内部表数据
2、hive外部表hbase数据
速度根本不是一个数量级的!这一块儿如果真要应用impala查hbase数据,还要深究!
之前都是用impala查hive共享的数据,今天测试查了一下hbase的数据,方法很简单,就是hive里建hbase的外部表,用impala查询hive外部表的数据,发现一个问题,相同数据的情况下,查询hbase表数据和hive差别太大,如下图:
同样的数据量:
1、hive内部表数据
2、hive外部表hbase数据
速度根本不是一个数量级的!这一块儿如果真要应用impala查hbase数据,还要深究!