GreenPlum6.x之测试数据

33 篇文章 0 订阅
30 篇文章 0 订阅

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

提示:这里可以添加本文要记录的大概内容:

分布式关系型数据库集群搭建好了,试下是否如网上所述处理的数据具有高性能的优势,所以导入500万条测试数据进行简单的试下


提示:以下是本篇文章正文内容,下面案例可供参考

一、generate_series是什么?

GreenPlum是基于PostgreSQL - 使用generate_series函数生成大量测试数据。
generate_series(start, stop, step)函数
生成一个数值型序列,从 start 到 stop,步进为 step。

列: select * from generate_series(2,4); 结果为 2,3,4

二、使用步骤

1.建张测试表

代码如下(示例):

create table gpdb.test1

(uid varchar(10),gnd varchar(4),

name varchar(100),phone varchar(11)

)distributed by (uid);

2.插入简单的测试数据

代码如下(示例):

insert into test1

(uid,gnd,name,phone)

select

floor(random()*10000000000)

,(array['男','女','其他'])[floor(random()*3)::int+1]

,(array['小四','小花','小凡'])[floor(random()*3)::int+1] 

,floor(random()*(10000000000-13899999999)+13899999999) 

from generate_series(1,5000000);

3.查看数据分散情况

代码如下(示例):

select  gp_segment_id,count(*) from test1 group by 1

在这里插入图片描述
我搭建的环境部署了3个segment数据节点
500万数据分布在3个数据节点
在这里插入图片描述

4.通过SQL测试性能

代码如下(示例):

select phone ,count(*) from test1 group by 1
select gnd,count(*) from test1 group by 1
select phone,gnd ,count(*) from test1 group by phone,gnd

select gnd,count() from test1 group by 1
500万数据执行时间2秒不到
在这里插入图片描述
select phone ,count(
) from test1 group by 1
500万数据执行时间5秒不到
在这里插入图片描述
select phone,gnd ,count(*) from test1 group by phone,gnd
500万数据执行时间5.1秒左右

总结

在普通数据库里500万数据使用group by统计确实比较慢,但在GreenPlum下测试觉的确实性能高

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

panda_225400

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值