Greenplum 可进行海量并行处理 (Massively Parallel Processing)
一、Greenplum 体系架构
Greenplum 由三部分组成:Master Host、Segment、Interconnect。
1.1 Master Host
- 访问系统的入口
- 数据库侦听进程 (postgres)
- 处理所有用户连接
- 建立查询计划
- 协调工作处理过程
- 管理工具
- 系统目录表和元数据(数据字典)
- 不存放任何用户数据
1.2 Segment
- 每段(Segment)存放一部分用户数据
- 一个系统可以有多段
- 用户不能直接存取访问
- 所有对段的访问都经过 Master
- 数据库监听进程(postgres)监听来自 Master 的连接
1.3 Interconnect
- Greenplum 数据库之间的连接层
- 进程间协调和管理
- 基于千兆以太网架构
- 属于系统内部私网配置
- 支持两种协议:TCP or UDP
Greenplum网络配置示例
说明:
(1) Master Host 和 StandBy Master 用广域网连接起来,满足用户网络提交的需求(对外)。
(2) 每个 Segment 主机上可以有多个 Segment 实例,每个 Segment 对应一个 CPU/网上,主要是避免资源争夺。本实例中有 4 个网口连接到 4 个虚拟的局域网,每个虚拟的局域网对应一个网段 172.16.0、172.16.1、172.16.2。
(3) ILOM 这个网口主要是控制台的控制,提供给管理员来访问每一台主机的接口。
二、Greenplum 高可用性体系架构
- Master Host 实时同步到 StandBy Master 节点上。
2.1 Master/Standby 镜像保护
- Standby 节点用于当 Master 节点损坏时提供 Master 服务
- Standby 实时与 Master 节点的 Catalog 和事务日志保持同步
2.2 数据冗余-Segment 镜像保护
- 每个 Segment 的数据冗余存放在另一个 Segment 上,数据实时同步
- 当 Primary Segment 失败时,Mirror Segment 将自动提供服务
- Primary Segment 恢复正常后,使用 gprecoverseg –F 同步数据。
Segment 主机硬件配置示例
2.3 网络冗余