GBase 8a集群性能优化之group by 多列hash重分布

最新推荐文章于 2022-09-22 10:22:26 发布

pengrander

最新推荐文章于 2022-09-22 10:22:26 发布

阅读量959

点赞数

分类专栏：数据库文章标签： dba 数据库性能优化

本文链接：https://blog.csdn.net/pengrander/article/details/123794794

版权

对随机分布表进行多列group by操作时，集群默认以group by的第一列对表进行hash重分布。当表数据量大，而group by的第一列唯一值较少时，会造成数据重分布到少数的几个节点，达不到多节点并行处理的效果，影响性能。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

pengrander

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
GBase 8a集群性能优化之group by 多列hash重分布

GBase 8a性能优化
复制链接

扫一扫

专栏目录

group by hash join优化案例

蘑菇丁的专栏

03-28

1770

原本有两个表，其中一个表的数据是150W 另一个表的数据是15W，他们两个hash join后花费的时间很长，后改成半连接后性能明显提升不少 SQL> conn hxy/hxy as sysdba Connected. SQL> create table t1 as select * from dba_objects where rownum Table created. SQL> cr

GROUP BY 的实现与优化

weixin_33860737的博客

04-23

由于GROUP BY实际上也同样需要进行排序操作，而且与ORDER BY相比，GROUP BY主要只是多了排序之后的分组操作。当然，如果在分组的时候还使用了其他的一些聚合函数，那么还需要一些聚合函数的计算。所以，在GROUP BY的实现过程中，与ORDERBY一样也可以利用到索引。在MySQL中，GROUP BY的实现同样有多种（三种）方式，其中有两种方式会利用现有的索引信...

参与评论您还未登录，请先登录后发表或查看评论

GBase 8a Mpp Cluster集群特性之多列哈希分布

最新发布

zhu1981hui的博客

09-22

155

•使用uint32保存CRC32的值，如果多个CRC32值相加越界，不影响数据分布。•多列HASH通过将多个列计算的CRC32值相加并对65535取模作为HASH值。•单列HASH通过CRC32函数计算HASH值。

GBase 8a集群扩展是否可以并行

kevindaddy的博客

02-07

943

GBase 8a集群的集群扩容时，目前为保证业务不间断采用的是基于表粒度的扩容方式，可以多个表并行同时扩容，也可以一个个表的顺序执行扩容。

再议hash group by

05-27

158

前面提到10.2版本以上hash group by 问题，以下一个帖子中例子也是出现hash group by问题。http://forums.oracle.com/forums/thread.jspa?...

南大通用GBase 8a集群管理培训资料

09-18

1-GBase 8a MPP Cluster 产品介绍.pdf 2-GBase 8a MPP Cluster 安装部署.pdf 3-GBase 8a MPP Cluster 日常... 8-GBase 8a MPP Cluster 集群管理-节点替换.pdf GBase 8a MPP Cluster 日常维护数据迁移sql操作练习.pdf

GBASE8A的jdbc驱动

11-04

GBase 是南大通用数据技术有限公司推出的自主品牌的数据库产品，目前在国内数据库市场具有较高的品牌知名度。GBase系列产品包括：新型分析型数据库...目前这工驱动是GBASE8A的jdbc驱动，找了好久才找到的，亲测可用。

GBase 8a SQL参考手册

08-17

**GBase 8a SQL 参考手册**是南大通用数据技术有限公司为用户提供的一份详细文档，旨在介绍GBase 8a分析型数据管理系统中支持的SQL语言特性。手册覆盖了从基本的数据类型到复杂的SQL语句和存储过程，为开发者和...

GBase 8a MPP Cluster GCmonit与集群启停工具使用手册.pdf

08-20

【GBase 8a MPP Cluster GCmonit与...总之，GBase 8a MPP Cluster的GCMonit和集群启停工具是高效管理数据库集群的关键组件，通过深入理解和熟练运用这些工具，用户可以确保集群的稳定性和性能，提高数据服务的可靠性。

性能调优8：分组聚合 - group by

albh81462的博客

01-15

181

聚合实际上对数据做分组统计，SQL Server使用两种操作符来实现聚合，流聚合（Stream Aggregation）和哈希聚合（Hash aggration）。流聚合是非阻塞性的，具有流的特性，流聚合操作符；边处理数据，边输出聚合的结果。而哈希聚合是阻塞性的，只要处理完所有的数据，才会输出聚合的结果。一，流聚合流聚合要求输入的数据集在group by 即分组列上是有序的，也就...

GBase 8a数据库数据重分布过程

kevindaddy的博客

01-19

619

集群有3种状态： Normal(正常模式），ReadOnly（只读模式），Recovery（维护模式）一、扩容在扩容过程中，集群的状态会发生变化，状态变更顺序为： NORMAL -> READONLY -> RECOVERY -> NORMAL Ø 数据准备阶段：集群状态为READONLY，只允许查询。在这个阶段，从原有节点向新的节点进行数据迁移，新节点生成数据副本。 Ø 数据切换阶段：集群状态为RECOVERY，集群不能对外提供任何服务。集群在这个阶段，完成新节点的主分片做表的Ren

GBase产品学习-hash分布表

lingzi113的博客

04-26

924

GBase 8a MPP Cluster执行单个hash分布表select语句，WHERE子句中只有一个hash分布列条件，语句会下发到和条件比较值的hash运算值相匹配的计算节点上。 hash分布表能计算出数据具体落在哪个节点上，所以不是所有节点都查询，只下发到有该数值的节点执行即可。 ...

oracle hash 聚合,HASH GROUP BY与SORT GROUP BY

weixin_35102377的博客

04-04

1037

本帖最后由北京大豆于 2013-9-2 18:20 编辑(1).分组算法在10g以前，GROUP BY是通过按照GROUP BY中的列对记录进行排序实现的。10g以后，HASH GROUP BY通过在读取表时将聚合计算在散列表中避免了排序。理论上，HASH GROUP BY应该比SORT GROUP BY速度快很多并消耗更少的内存。然而，HASH GROUP BY的初始实现bug很多。在11....

hash group by导致ORA-600

cuilin2183的博客

07-21

308

今天，在测试一个过程的是遇到一个ORA-00600错误：Errors in file /opt/oracle/admin/citizen/bdump/citizen_j000_25812.trc:ORA-00600: inter...

GBase 扩容操作重分布完成后清理旧的distribution时报错FCan not drop nodedatamap EventLog is using distribution

jingjing1068的博客

04-18

458

GBase 8a在扩容操作中，当所有表已经全部重分布到新的分布策略distribution以后，老的distribution就可以用refreshnodedatamap drop删除了。但如果此时有些表存在event,且使用的老的策略，则会出现这个错误：Can not drop nodedatamap EventLog is using distribution。此时需要将原有的event处理完成才可以继续操作。换个角度，如果是扩容，在操作前将集群状态全部恢复正常，没有event会更合适一些，可以减少运

sort group by和hash group by性能比较

关注系统性能调优

06-08

9292

在10gR2中，group by由以前的sort group by改成了hash group by，这种算法上的改进，取消了sort group by必须进行的排序操作。官方文档上说hash group by的性能强于sort group by，但经过我的测试，不管是逻辑读和cost都是一样的。 SQL>create table test as select * from dba_objects

GBase 8a集群SQL参考手册-南大通用数据技术有限公司

"GBase 8a Cluster SQL参考手册提供了南大通用数据技术有限公司的GBase 8a集群数据库系统的SQL语法和数据类型的详细信息。该手册强调了文档的版权和使用规定，用户只能在合法范围内查阅、复制和打印。GBase是南大...