tpc-ds基准测试案例-hive

 

环境条件及测试套件准备

 

 

编译并打包相应的数据生成器

# unzip hive -testbench-hdp3.zip

# cd hive -testbench-hdp3

# ./tpcds-build.sh

 

生成数据和查询sql

# su - hdfs

$ export FORMAT=rcfile

$ bash -x tpcds-setup.sh 2 /data/tpcds-generate

FORMAT=rcfile:代表数据文件格式,export FORMAT=rcfile可以不需要;默认生成是orc文件格式

2:代表生成10G数据

/data/tpcds-generate:代表生成数据的目录

 

上面用了hdfs去执行tpcds-setup.sh文件,会导致无法写入makefile文件,报错如下:

所以解压的hive -testbench-hdp3目录权限尽量给大一些。

最终成功的结果如下:

 

生成数据的案例

构建1 TB的TPC-DS数据: ./tpcds-setup.sh 1000

构建1 TB的TPC-H数据: ./tpch-setup.sh 1000

构建100 TB的TPC-DS数据: ./tpcds-setup.sh 100000

构建30 TB文本格式的TPC-DS数据: FORMAT=textfile ./tpcds-setup 30000

构建30 TB RCFile格式的TPC-DS数据: FORMAT=rcfile ./tpcds-setup 30000

 

 

测试查询执行

# su - hive

$ hive

hive> use use tpcds_bin_partitioned_orc_4;

hive> source query12.sql;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值