背景
数据仓库系统架构
此部分介绍 Amazon Redshift 数据仓库架构的元素,如下图所示。
客户端应用程序
Amazon Redshift 与各种数据加载和 ETL(提取、转换和加载)工具以及商业智能 (BI) 报告、数据挖掘和分析工具集成。Amazon Redshift 基于行业标准 PostgreSQL,因此,大多数现有 SQL 客户端应用程序仅处理最少量的更改。有关 Amazon Redshift SQL 和 PostgreSQL 之间的重要差异的信息,请参阅 Amazon Redshift 和 PostgreSQL。
连接
Amazon Redshift 通过使用行业标准 PostgreSQL JDBC 和 ODBC 驱动程序与客户端应用程序进行通信。有关更多信息,请参阅 Amazon Redshift 和 PostgreSQL JDBC 以及 ODBC。
群集
Amazon Redshift 数据仓库的核心基础设施组件是群集。
群集包含一个或多个计算节点。如果群集预置有两个或更多计算节点,则一个额外的领导节点 将协调这些计算节点并处理外部通信。您的客户端应用程序仅直接与领导节点交互。计算节点对于外部应用程序是透明的。
领导节点
领导节点管理与客户端程序的通信以及与计算节点的所有通信。它分析和制定执行计划以实施数据库操作,特别是获得复杂查询的结果所需执行的一系列步骤