Impala、Hive性能简单对比测试

最新推荐文章于 2024-05-03 08:42:23 发布

lipeng_bigdata

最新推荐文章于 2024-05-03 08:42:23 发布

阅读量6.1k

点赞数 3

分类专栏： Impala

本文链接：https://blog.csdn.net/lipeng_bigdata/article/details/51065904

版权

Impala 专栏收录该内容

6 篇文章 2 订阅

订阅专栏

Impala、Hive性能简单对比测试

一、测试环境

操作系统：CentOS6.4

大数据平台：CDH5、Hive、Impala、MapReduce

集群规模：3台服务器，每台64G内存（原谅小气的公司给了如此糟糕的开发环境）

Impala共三几个后台Impalad进程，两个正常，一个失效，如图：

一、HBase加载数据

首先，在HBase中创建一个表，表中列簇为f，有两列dn、fn；

其次，利用Java API在HBase中产生约1000万条测试数据，代码如下：

	@SuppressWarnings("static-access")
	@Test
	public void testPutBasic() {

		for (int m = 0; m < 20; m++) {
			new Thread() {
				@Override
				public void run() {
					int j = 0;
					for (int i = 0; i < 1000000; i++) {
						Random random = new Random();

						Hashtable<String, String> pColumns = new Hashtable<String, String>();
						pColumns.put("dn", "dn" + random.nextInt(100));
						pColumns.put("fn", "fn" + random.nextInt(100));

						try {
							HBaseUtil.postBasic("impala_hbase_test_table",
									this.getName() + "a" + j++, "f", pColumns,
									null);
						} catch (Exception e2) {
							// TODO Auto-generated catch block
							e2.printStackTrace();
						}
					}
				}
			}.start();
		}

		try {
			Thread.currentThread().sleep(1000000000l);
		} catch (InterruptedException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}

3、查看HBase数据量，共10643213条，如图：

二、Impala、Hive加载HBase数据

1、Hive使用DataBase hive_hbase，如图：

2、Hive加载HBase数据，执行语句如下：

CREATE EXTERNAL TABLE impala_hbase(
rk string,
dn string,
fn string)
ROW FORMAT SERDE 'org.apache.hadoop.hive.hbase.HBaseSerDe'
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key, f:dn, f:fn")
TBLPROPERTIES("hbase.table.name" = "impala_hbase_test_table");

执行截图图如下：