自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (31)
  • 收藏
  • 关注

原创 分布式join和agg的实现方式

先将两张大表按照Join Key将左表和右表的数据 Shuffle到参与Join计算的节点,Join Key相同的数据,Hash值一定相同,一定会被分发到相同的计算节点,不同的计算节点之间的数据Join的结果一定是空的,就是一定不满足关联条件。这是最常见的做法,适用于Agg结果数量少的场景,对于Agg结果数量较大或集群规模较大的场景,存在单点计算瓶颈的问题,即汇总数据后,做最后一次Agg的节点,会成为整个计算的瓶颈。每个节点都有完整的小表,这样能保证Join的结果是正确的。

2024-07-31 14:05:23 652

阿里云数据库以“被集成”方式与生态伙伴共建繁荣生态

阿里云数据库以“被集成”方式与生态伙伴共建繁荣生态

2024-08-06

华为云 GaussDB 数智跃升打造全场景更优数据底座

华为云 GaussDB 数智跃升打造全场景更优数据底座

2024-08-05

腾讯云TDSQL构建高效可靠的数据库新生态

腾讯云TDSQL构建高效可靠的数据库新生态

2024-08-05

Napa Powering Scalable Data Warehousing with Robust Qery Perform

Napa: Powering Scalable Data Warehousing with Robust Qery Performance at Google

2021-11-23

Crystal A Unified Cache Storage System for Analytical Databases

Crystal A Unified Cache Storage System for Analytical Databases

2021-11-23

The Snowflake Elastic Data Warehouse

The Snowflake Elastic Data Warehouse

2021-11-22

Dremel- A Decade of Interactive SQL Analysis at Web Scale

Dremel- A Decade of Interactive SQL Analysis at Web Scale

2021-11-19

云原生数据库PolarDB产品技术 —— 之弹性技术实践

云原生数据库PolarDB产品技术 —— 之弹性技术实践

2021-11-10

YARN 与 K8s 的容器化资 源混部实践

YARN 与 K8s 的容器化资 源混部实践

2021-11-10

Kubernetes的云数据库建设实践

Kubernetes的云数据库建设实践

2021-11-10

2021上半年软件设计师真题及答案解析

解析很详细

2021-11-05

2004~2020全年试题及答案解析 软件工程师 软考 中级

2004~2020全年试题及答案解析 软件工程师 软考 中级

2021-11-02

Everything About Compiled and Vectorized

Everything About Compiled and Vectorized

2021-10-20

Vectorization vs. Compilation in Query Execution.pdf

Vectorization vs. Compilation in Query Execution.pdf

2021-10-20

Elastic Stack 技术指南

一本 Elastic Stack 技术指南,帮助大家厘清技术细节,分享一些实战案 例,成为我近半年一大心愿。

2018-05-15

云平台-阿里云详细介绍

阿里云详细介绍,包括资源管理,任务调度,双活,灾备,两地三中心,跨地域的计算等等

2018-04-13

google云计算体系架构详解

google云计算体系架构详解,详细介绍google云计算的各个组件,以及实现细节

2018-04-13

HybridTime算法详解

CockroachDB中文文档,CockroachDB技术的详细介绍,深入浅出,

2018-04-13

Tera大型分布式表格系统的设计与实践

Tera大型分布式表格系统的设计与实践,Tera大型分布式表格系统的设计与实践,

2018-04-13

infobright源码

infobright最新版的源码,data pack,knowledge node。

2013-09-29

hadoop最新源码

hadoop最新源码,阿帕奇版本的

2013-09-29

office寻找js

office寻找js

2011-12-06

Struts2.0学习系列 以及 Struts2.0安装包

Struts2.0学习系列 以及 Struts2.0安装包 WORD文档里包含图片和文字,讲解非常详细, 一步一步的教你.

2009-10-22

Struts2.0学习系列

好的struts2.0入门教程,对学习struts有很大的帮助

2009-10-19

最新版的fatjar

最新版的fatjar,最新版的fatjar,最新版的fatjar

2009-10-09

VC+MapX实现的GPS

VC+MapX实现的GPS,VC+MapX实现的GPS

2008-10-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除