GreenPLum
xiaochuan1225
这个作者很懒,什么都没留下…
展开
-
20160509 GreenPlum1 简介
1 数据管理解决方案:Teradate、GreenPlum、Hadoop Hive、Oracle Exadate、IBM Netteza等 2 使用GP的公司:纳斯达克、纽约证券交易所、Skype.FOX 、T-Mobile,中国的企业有:中信实业银行、东方航空公司、阿里巴巴、华泰保险、中国远洋 3 数据库类型: OLTP(On-Li原创 2016-05-09 15:57:38 · 370 阅读 · 0 评论 -
20160512 GreenPlum13 查询自己建的表名
select * from pg_tables where schemaname = 'yb_user' order by tablename;原创 2016-05-12 16:33:43 · 2324 阅读 · 0 评论 -
20160509 GreenPlum3 基本语法
1 复制他表的结构,不指定分布健那么默认分布健和xh1一样 #create table xh(like xh1);2原创 2016-05-09 17:05:43 · 1480 阅读 · 0 评论 -
20160512 GreenPlum11 分布式的关联
分布式的关联有两种方式:单库关联和跨库关联单库关联指的是关联健和分布键一样,直接关联就行,不需要数据迁移跨库关联指的是关联键和分布健不一样,数据得先重分布后再进行单库关联,跨库关联有两个办法,例如inner join时,#select * from A,B where A.id=B.id' 其中A的关联键是分布键但是B的关联键不是分布键: 1 :将B按照i原创 2016-05-12 10:25:01 · 932 阅读 · 0 评论 -
20160512 GreenPlum12 字段类型变更
可以将工资由numeric转换成varchar类型,最好另起一张表:create table lianxi3 as select 部门,number,工资::varchar from lianxi distributed by(number);原创 2016-05-12 10:46:15 · 6881 阅读 · 0 评论 -
20160510 GreenPlum4 SQL中求和相关语句的总结
原创 2016-05-10 10:18:15 · 1579 阅读 · 0 评论 -
20160512 GreenPlum10 SharedNothing架构、数据迁移
SharedNothing架构的特点是:底层数据完全不共享,每个Segment只有一部分数据,每一个节点都通过网络连接在一起。也就是各个处理单元都有自己独立的CPU、内存、硬盘,不存在共享资源,类似于MPP大规模并行处理模式,各节点独立处理自己的数据,处理完在上层进行汇总。 数据迁移:两张表进行关联时,如果关联的数据不在一个节点上,是关联不上的,需要将数据汇入一个节点上才能关联原创 2016-05-12 10:11:36 · 443 阅读 · 0 评论 -
20160511 GreenPlum9 索引
建立索引可以提高查询的速度: 普通查询:# create table lianxi2 as select * from lianxi1 distributed by(id);# select id,flag from lianxi2 where id=100; 索引查询:# create index lianxi2_index on lianxi2(id);#原创 2016-05-11 17:15:56 · 355 阅读 · 0 评论 -
20160511 GreenPlum7 分区表
第一遍看书没太理解分区表,不知道是什么,暂且先这样记吧:这是在不同segment上数据的分布情况:#select gp_segment_id,* from lianxi;91 发展部 11 520090 发展部 10 520038 发展部 9 450043 销售部 4 480046 销售部 1 500040 发展部 7 420039 发展部 8 600044原创 2016-05-11 14:13:05 · 462 阅读 · 0 评论 -
20160511 GreenPlum8 数据倾斜对数据的影响
测试数据为: #drop table lianxi1; #create table lianxi1 as select a as id,round(random()) as flag,repeat('a',1024) as value from generate_series(1,5000000) a distributed by(id);原创 2016-05-11 17:05:10 · 851 阅读 · 0 评论 -
20160511 GreenPlum6 分析函数之开窗函数、聚合函数与grouping sets用法
1 开窗函数 测试数据为: 部门 number 工资 发展部 8 6000 发展部 10 5200 销售部 1 5000 销售部原创 2016-05-11 13:41:50 · 3562 阅读 · 1 评论 -
20160510 GreenPlum5 常用函数
1 序列生成函数 生成多行数据 #select * from generate_series(6,10); ---6 7 8 9 10 可以创建测试表数据,很方便 #create table xh as select generate_series(1,100) as id,'erlonglong'::text as n原创 2016-05-10 14:28:15 · 1288 阅读 · 0 评论 -
20160509 GreenPlum2 使用及解答
1 登录GP:通过图形界面的GUI,pgAdmin III。 2 数据分布:Master节点本身不存储数据,所有的数据拆分保存到每一个节点上 分布方式有两种: 指定分布健时,按照分布健的Hash值分布数据为哈希分布,计算Hash值,通过这个值路由到特定的Segment节点,语法为distributed by,如果原创 2016-05-09 16:57:13 · 246 阅读 · 0 评论