AWS Redshift
Redshift knowledge sharing
Tech_Sharing
We are focus on AWS Tech,but not limit to this
展开
-
AWS Redshift 查询的执行计划(2)
– 准备测试表及数据create table t1_even (id int, col1 varchar(100), col2 varchar(100)) diststyle key distkey (id);create table t2_even (t1_id int , col1 varchar(100), col2 varchar(100)) diststyle even;create table t3_key (t1_id int, col1 varchar(100), col2 varch原创 2020-09-12 15:46:26 · 265 阅读 · 0 评论 -
AWS Redshift 查询的执行计划(1)
首先,需要了解一条查询在 Redshift 中所执行的步骤。领导节点接收查询并解析 SQL。、分析程序生成初步查询树,后者是原始查询的逻辑表示。然后,Amazon Redshift 将该查询树输入到查询优化程序中。优化器会评估,如有必要,请重新写入查询以最大程度提高效率。这个过程有时会导致创建多个相关查询来替换单个。优化程序生成查询计划(或若干以上步骤,如果上一步导致执行多个查询),则执行最佳性能。查询计划指定执行选项,例如联接类型、联合订单、聚合选项和数据分发要求。执行引擎将原创 2020-09-09 17:25:28 · 466 阅读 · 0 评论 -
Redshift - 表设计
AWS Redshift 中设计表AWS Redshift 是基于 PostgreSQL 的数据仓库。 那么如何创建一个表, 这个表的创建于普通的关系型数据库的表有什么不同呢?在创建 Redshift table 时, 可以选择排序键、分配方式和压缩编码。设计表是为了 减少 I/O 操作数和尽量减少处理查询所需的内存。Sort key:排序键将您的数据按照排序顺序存储在磁盘中。Amazon Redshift 查询优化程序在确定最佳查询计划时会使用排序顺序。如何选择排序键:根据需要频繁查询的数原创 2020-09-09 00:05:12 · 691 阅读 · 0 评论 -
Amazon Redshift - 体系结构-基本介绍
Amazon Redshift 数据仓库是一个企业级的关系数据库查询和管理系统。特点:支持与多种类型的应用程序建立客户端连接多阶段操作。(检索、比较、计算)MPP(大规模并行处理), 列式存储,架构:基于 PostgreSQL 8.0.2 , 通过 PostgreSQL JDBC 和 ODBC 驱动程序进行通信。以集群形式存在。群集由一个或多个组成 compute nodes 。如果群集配置了两个或以上计算节点,则需要 leader node 协调 compute 节点并处理外部通信。原创 2020-09-03 11:49:07 · 970 阅读 · 0 评论