Greenplum vs Deepgreen - gpfdist外部表和xdrive hdfs对比测试

今天给大家分享一篇关于Greenplum与Deepgreen外部数据加载的小测试。

首先必要的前提条件有:

1)Greenplum 4.3和Deepgreen 16.x安装完毕

2)已经搭建好xdrive环境和gpfdist环境

3)准备测试文件:number.csv 写入一亿条数据。例如:for((i=1;i<100000000;i++));do echo '1,2,3' >> number.csv;done     写入后文件大小:573M

4)将测试文件分别挂载到本地hdfs和本地gpfdist:

    hdfs dfs -put /home/hadoop/number.csv /home/hadoop/input

    gpfdist -d /home/hadoop -p 8081 &

5)分别创建两个外部表,对应两种方式(xdrive和gpfdist):

    create external table number_xdrive(n1 int,n2 int,n3 int) location ('xdrive://localhost:50000/dw/number.csv') format 'csv’;

    create external table number_gpfdist(n1 int,n2 int,n3 int) location ('gpfdist://localhost:8081/number.csv') format 'csv’;

6)分别执行一下select limit 10语句查看是否可以访问数据。

 

测试场景及时间对比:

1.count测试:

1)Deepgreen Xdrive

507c309b1a285238bee3c76ebcf86ab8f25.jpg

2)Deepgreen gpfdist

7bcb628acb3cc261e2463889026cd80bf88.jpg

3)Greenplum gpfdist

4ed00b30847db8e7d172bddbed19d84fb5e.jpg

2.select * 测试:

1)Deepgreen Xdrive

bf1127e4f1c06300d9c29a9dc533e4b6f35.jpg

2)Deepgreen gpfdist

f75644bb4086a51316e75af4ecaf68e5dd6.jpg

3)Greenplum gpfdist

113d5284eefb677da9836be01db05a665a3.jpg

3.group by 测试:

1)Deepgreen Xdrive

98587f297e1c1fe74f0d14e4e892b261fac.jpg

2)Deepgreen gpfdist

1537919c3551602aace4ef961797983c6f9.jpg

3)Greenplum gpfdist

7dbb1f20e0afbae6dd360a6bf71bf9cca20.jpg

4.带where条件的查询:

1)Deepgreen Xdrive &gpfdist

ebfbe1ef366f1aefea2db478e890d1d3867.jpg

2)Greenplum gpfdist

a581d4972835b7a0c27183a95e830b64d3b.jpg

 

转载于:https://my.oschina.net/javacy/blog/2998514

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值