GBase 8a MPP Cluster 核心技术 - MPP 大规模并行计算技术

GBase8aMPPCluster是一款支持非对称部署的联邦架构,具备分布式并行处理、高效执行计划、高可用设计、高性能扩展和多租户隔离等功能。它能处理大规模数据,支持在线扩展,提供实例级、库级和表级备份恢复,以及灵活的多实例部署和数据加载能力。
摘要由CSDN通过智能技术生成

  GBase 8a MPP Cluster 为非对称部署的联邦架构,三大核心组件均可单独部署,其中GCluster 调度集群和 GCWare 管理最大节点数为 64,GNode 计算集群支持 1000 个以上的节点部署,可处理 100PB 以上的结构化数据。

大规模并行计算

  GBase 8a MPP Cluster 采用 MPP 技术,主要特点有:

  1. 分布式并行计划器,结合集群特征,对算子行进分布式处理,生成适
    合的分布式执行计划;
  2. 通过基于规则和基于代价的优化,保证执行计划的高效;
  3. 调度器采用异步 I/O 等技术,确保调度的高效、可靠;

高可用能力

  GBase 8a MPP Cluster 通过冗余机制来保证集群的高可用特性:

  1. 可提供 1 个或 3 个副本数据冗余(3 个副本表示 1 个主分片和 2 个备
    份分片);
  2. 副本间数据自动同步;
  3. 复制引擎自动管理数据同步;
  4. 多分片机制降低节点故障的木桶效应;
  5. 节点发生故障时,系统自动切换至其它节点进行工作,保证业务连续性;
  6. 支持双活集群部署。

  集群副本数和分片数可进行灵活配置,可配置副本分片到集群的任意一个节点上,可以根据配置在主机性能高和存储空间大的节点分配更多的主本和副本。
  当节点出现异常时,可以将异常服务器的负载均匀分布在副本所在的几台正常的服务器上。这样就最大限度防止由于故障切换后木桶效应而引起的显著的性能抖动。节点故障对应用透明,不会中断正在执行业务,一旦故障节点恢复正常,GBase 8a MPP Cluster 会从其他节点上的数据恢复该节点数据,在完成更新后立即提供服务。
图 3-4 数据分片和副本分片的灵活配置

高性能扩展能力

  GBase 8a MPP Cluster 能够通过增加服务器节点对系统的计算和存储能力进行扩容,支撑成百上千个节点规模的集群,且扩展过程可进行监控、暂停、恢复、取消等灵活的监控及管理;系统支持在线扩展,性能线性提升,无需中断当前系统的运行,且支持一次扩展多个节点;可支持实例级、库级、表级等多级别灵活扩展方式。
  GBase 8a MPP Cluster 具备高性能扩展能力:

  1. 在线动态扩展集群节点;
  2. 每个节点可以处理 100TB 有效数据,同时提供计算和存储能力;
  3. 执行调度节点和数据计算节点可以按需独立扩展。
    图 3-5 GBase 8a MPP Cluster 扩展技术示意图

  上图中最后一个“执行调度节点”和“数据存储及计算节点”是在原有节点基础上新扩展的节点,可以扩展调度节点,也可以扩展存储和计算节点。因为 GBase 8a MPP Cluster 采用高性能单节点的 MPP 架构,因此进行集群扩展时,可以保证平滑扩展和性能的线性增长特性,如下图所示:
图 3-6 GBase 8a MPP Cluster 高性能高扩展示意图

高性能数据加载能力

  GBase 8a MPP Cluster 数据加载功能实现了所有数据计算节点并行处理数据及副本转发技术,具备很高的加载性能:
1)在单台数据服务器的情况下,集群加载可以达到数据服务器硬件资源性能的上限;
2)随着数据服务器和集群节点数的增加,集群加载性能可以持续提升。
图 3-7 GBase8a MPP Cluster 数据加载示意图

多租户能力

  GBase 8a MPP Cluster 可以通过虚拟集群技术实现租户间的物理或者逻辑隔离。
  在虚拟集群内对计算节点进行分组,形成多个虚拟子集群,每个虚拟子集群在资源上物理隔离,在命名空间上逻辑隔离。虚拟集群为所有子集群提供统一的访问入口、元数据视图、执行调度、认证和权限管理。在一个虚拟子集群的每个计算节点上,通过资源管理和资源组灵活配置不同应用和用户的资源配额和查询优先级。
  通过完善的权限授权管理机制下,使得不同的应用运行在不同的虚拟子集群中;同一个应用的不同类型的任务运行在同一个子集群中,但具有不同的资源配额和优先级,相互之间又得到必要的隔离。就好像运行在透明的“沙箱”一样。

备份和恢复

  大数据不仅仅对数据处理和分析查询的性能带来挑战,对备份和恢复的要求也更高。因为数据量巨大,如果备份和恢复的速度跟不上,在意外、故障或灾难发生时,无法及时使数据库得到恢复,系统和业务的可用性就无法得到保障。
  GBase 8a MPP Cluster 提供全面的基于实例级、库级、表级的备份和恢复功能,包括:

  1. 全量备份和恢复;
  2. 增量备份和恢复:允许基于任意一个备份点进行数据恢复;
  3. 支持将数据备份到 Hadoop 及从 Hadoop 中恢复数据。

多实例部署

  在一个物理服务器上部署多个 data 计算节点,每个计算节点称为一个数据库实例。多实例部署示意图如下:
图 3-8 GBase 8a MPP Cluster 多实例部署示意图

  在一个物理机上安装多个计算节点,每个计算节点对应服务器的一个 NUMA节点,通过 NUMA 节点绑定实现 CPU、内存等资源隔离和充分使用,规避跨 NUMA节点运算带来的性能损耗。通过多实例部署可以有效发挥高配置服务器以及NUMA 架构服务器的性能,相比于在一个物理服务器上只部署一个计算节点,能够提升 1 倍以上的计算性能。

服务注册机制

  随着集群规模的不断扩大,用于集群管理的成本会越来越高。GBase 8a MPPCluster 支持 data 计算节点服务状态注册机制,data 计算节点定期主动向gcware 管理集群中注册本地服务状态。该机制可提高 data 计算节点状态监测的准确性和时效性,降低少量计算节点异常对集群带来的影响。Data 节点向 gcware 注册的信息用途包括:

  • Data 节点所属的 vc;
  • 用于 data 节点状态监测的长连接 sessionid 和节点 nodeid;通过注册的 sessionid 跟踪 data节点心跳,心跳中断后 gcware 管理集群设置该 data 节点状态为异常;
  • 注册全局一致的重点参数取值,如 gbase_compression_str_method、gbase_compression_num_method 和 gbase_segment_size,同一个 VC 内的重点参数不一致时无法启动 data 计算节点的服务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值