20160512 GreenPlum10 SharedNothing架构、数据迁移

SharedNothing架构的特点是:

底层数据完全不共享,每个Segment只有一部分数据,每一个节点都通过网络连接在一起。

也就是各个处理单元都有自己独立的CPU、内存、硬盘,不存在共享资源,类似于MPP大规模并行处理模式,各节点独立处理自己的数据,处理完在上层进行汇总。

 

数据迁移:

两张表进行关联时,如果关联的数据不在一个节点上,是关联不上的,需要将数据汇入一个节点上才能关联,这就需要进行数据的迁移,迁移方式有两种:广播和数据重分布。

重分布举一个例子,比如一张成绩表,分布健是id,以成绩score进行group by分组,那么就需要将数据按照成绩进行重分布,重分布前会对每一个segment上的数据进行汇总,重分布后,同样分数score的数据就会在一个segment上,在汇总一次就可以了。

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值