distribute by hash

建表语句:

create table xxx.CCRD_CUSTR_HIS
(
	BG_DT_ZCC DATE not null,
	ED_DT_ZCC DATE not null,
	CUSTR_NBR VARCHAR(19) not null,
	RACE_CODE VARCHAR(2),
	CUSTR_REF VARCHAR(20),
	primary key (BG_DT_ZCC, ED_DT_ZCC, CUSTR_NBR)
)
distribute by hash (BG_DT_ZCC, ED_DT_ZCC, CUSTR_NBR);

comment on table xxx.CCRD_CUSTR_HIS is '客户基本资料';

comment on column xxx.CCRD_CUSTR_HIS.BG_DT_ZCC is '数据生效日期';

comment on column xxx.CCRD_CUSTR_HIS.ED_DT_ZCC is '数据到期日期';

comment on column xxx.CCRD_CUSTR_HIS.CUSTR_NBR is '客户证件号码';

comment on column xxx.CCRD_CUSTR_HIS.RACE_CODE is '证件类型';

comment on column xxx.CCRD_CUSTR_HIS.CUSTR_REF is '客户参考资料编号';

在最后一行的 distribute by hash (BG_DT_ZCC, ED_DT_ZCC, CUSTR_NBR); 中,指定了数据在表分区中的分布方式。这里使用了 HASH 方法,并根据三个列 BG_DT_ZCCED_DT_ZCCCUSTR_NBR 的哈希值来进行数据分布

哈希函数将这三列的值作为输入,并生成一个唯一的哈希值。根据这个哈希值,DB2会决定将每条记录放置在哪个分区上。通过这种方式,数据被均匀地分布到不同的分区,从而实现负载均衡,使每个分区处理的数据量大致相同,避免出现数据倾斜,提高查询性能和系统吞吐量。

哈希分布还具有另一个优势:当在查询中需要进行基于这三列的连接操作时,具有相同哈希值的数据很可能位于相同的分区中,这样可以避免在多个分区之间进行数据移动,从而加速查询操作。

总而言之,使用 "distribute by hash" 和合适的哈希列来分布数据是一种常见的数据库优化手段,能够提高数据库的性能和可扩展性

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值