测试presto benchmark

1、下载

https://repo1.maven.org/maven2/com/facebook/presto/presto-benchmark-driver/0.216/presto-benchmark-driver-0.216-executable.jar

2、修改文件名

mv presto-benchmark-driver-0.216-executable.jar presto-benchmark-driver

#增加执行权限
chmod +x presto-benchmark-driver

3、新建文件suite.json

{

"file_formats": {

"query": ["hive_orc*.*","tpcds*.*"],

"schema": [ "hive_orc.*" ],

"session": {}

}

}

4、新建sql文件夹

里面是要测试的sql语句,每条语句一个文件,名称是hive_orc1.sql ,hive_orc2.sql 等,以及tpcds1.sql,tpcds2.sql等,结尾不能有分号。

5、测试运行

注意:和suite.json文件在同一目录下,sql文件夹也要和suite文件在相同目录下 

/opt/presto/presto-server-0.215/bin/presto-benchmark-driver --server 192.168.6.12:8080 --debug  --catalog hive --schema hive_orc

[hadoop@sdw-12 bin]$ /opt/presto/presto-server-0.215/bin/presto-benchmark-driver --server 192.168.6.12:8080 --debug  --catalog hive --schema hive_orc
2019-02-01T10:23:33.363+0800	INFO	main	io.airlift.log.Logging	Logging to stderr
suite	query	wallTimeP50	wallTimeMean	wallTimeStd	processCpuTimeP50	processCpuTimeMean	processCpuTimeStd	queryCpuTimeP50	queryCpuTimeMean	queryCpuTimeStd	status	error
file_formats	hive_orc8	63292	64056	2082	1425610	1421273	14983	1052408	1051609	3077	pass
file_formats	tpcds11	58791	58505	950	904370	898313	14459	691455	683139	16685	pass
file_formats	tpcds15	35936	36196	1467	550660	550780	4971	417760	416297	3124	pass
file_formats	tpcds3	5193	5137	399	187760	186900	2984	165786	166728	2299	pass
file_formats	tpcds8	19918	19903	294	257390	257613	866	194372	194872	1122	pass
file_formats	hive_orc6	27017	27111	168	700710	701616	1963	588008	588608	1039	pass
file_formats	tpcds4	128051	128007	156	1876990	1871563	46965	1359416	1355799	41041	pass
file_formats	tpcds10	35190	35542	1142	431170	431400	790	290296	290390	1021	pass
file_formats	tpcds14	15014	15407	927	225260	223703	2748	172606	172456	2250	pass
file_formats	tpcds7	61047	59487	3664	895560	894683	18350	683081	676074	12291	pass
file_formats	hive_orc7	28232	27550	1263	702240	702670	2641	592209	591608	2163	pass
file_formats	hive_orc9	103957	103232	1913	1942470	1951846	16903	1413610	1414810	2614	pass
file_formats	tpcds5	21506	21093	1314	290770	292580	3657	221708	221340	1921	pass
file_formats	hive_orc5	944	957	105	30910	31600	1300	28564	28256	954	pass
file_formats	tpcds9	797	748	100	2470	2513	237	356	363	33	pass
file_formats	tpcds12	56768	58087	2440	1052170	1049936	18541	684967	685710	1972	pass
file_formats	tpcds2	19128	19974	1477	327680	326093	15570	199083	199424	2616	pass
file_formats	hive_orc2	939	824	215	56250	56620	1441	50822	50563	746	pass
file_formats	tpcds6	39439	40092	2332	569530	569010	4343	428067	426408	3814	pass
file_formats	hive_orc1	1064	1049	79	28950	29053	251	27433	27519	224	pass
file_formats	hive_orc3	1355	1392	140	83330	81783	2739	77133	76115	2152	pass
file_formats	tpcds1	19783	19629	410	258810	257503	2680	195191	194988	531	pass
file_formats	hive_orc4	3188	3093	228	175170	174560	1794	161333	162033	3012	pass

 

WallTime:用户要可以看到查询结果要等待的时间

processCpuTime:整个集群为助理查询而消耗的CPU时间,包含一些垃圾回收的时间

queryCpuTime:整个集群为助理查询而消耗的CPU时 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
版本:presto-server-0.214.tar软件版本 presto-cli-0.214-executableCentOS71、presto的起因 hadoop ---hdfs----MR(java)-----hivehive底层原理用MR,速度比较慢,公司hadoop集群主要集中于晚上到凌晨,平日工作时间负载不是很高。但在工作时间内,公司业务人员有实时查询的需求,现在主要借助于hive提供业务人员的查询。hive是基于MR类的SQL查询工具,他会输入的查询SQL解析为MapReduce,能极大的降低使用大数据门槛,让一般的业务人员可以直接准对大数据进行查询,但是有一个利弊,它的查询基于MR,会让人等待比较着急,等待的时间可能是几个小时或者一天。 spark基于内存提高改良的hive,sql,现在factbook在hive上面开发一套利器,准对hive可以通过sql语句快速查询,presto。2、Facebook为何开发Presto  Facebook的2011的数据仓库存储在少量大型hadoopfs集群,Hive是FaceBook在几年前专门为Hadoop打造的一款数据仓库工具,在以前,facebook的科学家和分析师一直靠hive进行数据分析.但hive使用MR作为底层计算框架,是专为批处理设计的,但是随着数据的不断增多,使用hive进行一个简单的数据查询可能要花费分钟或者几个小时,显然不能满足查询需求,FaceBooke也调研了其他比hive更快的工具,但是他们需要在功能有限的条件下做简单操作,以至于无法操作Facebook庞大的数据要求。2012年开始研究自己的框架--presto,每日可以超过1pb查询,而且速度比较快,faceBook声称Presto的性能比hive要好上10倍或者100倍,presto和hive都是facebook开发的 Presto是一个开源的分布式SQL查询引擎,适用于交互式查询,数据量支持GB到PB字节。Presto的设计和编写完全是为了解决Facebook这样规模的商业数据仓库交互式分析和处理速度的问题Presto可以做什么 Presto支持在线数据查询,包括Hive kafka Cassandra关系数据库以及专门数据存储,一条Presto查询可以将多个数据源进行合并,可以跨越整个组织进行分析。Presto以分析师的需求作为目标,他们期望相应速度小于1秒到几分钟,Presto要么在使用速度的快的昂贵的商业方案,提高内存,要么是消耗大量的硬件进行快速查询。(128G 64G)本套课程教给如何在企业环境中使用Presto技术。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值