7.备份和恢复
大数据不仅仅对数据处理和分析查询的性能带来挑战,对备份和恢复的要 求也更高。
因为数据量巨大,如果备份和恢复的速度跟不上,在意外、故障或 灾难发生时,无法及时使数据库得到恢复,系统和业务的可用性就无法得到保 障。
GBase 8a MPP Cluster 提供全面的基于实例级、库级、表级的备份和恢复 功能,包括:
1) 全量备份和恢复;
2) 增量备份和恢复:允许基于任意一个备份点进行数据恢复;
3) 支持将数据备份到 Hadoop 及从 Hadoop 中恢复数据。
8.多实例部署
在一个物理服务器上部署多个 data 计算节点,每个计算节点称为一个数据 库实例。多实例部署示意图如下:
在一个物理机上安装多个计算节点,每个计算节点对应服务器的一个 NUMA 节点,通过 NUMA 节点绑定实现 CPU、内存等资源隔离和充分使用,规避跨 NUMA 节点运算带来的性能损耗。
通过多实例部署可以有效发挥高配置服务器以及 NUMA 架构服务器的性能,相比于在一个物理服务器上只部署一个计算节点,能 够提升 1 倍以上的计算性能。
9.服务注册机制
随着集群规模的不断扩大,用于集群管理的成本会越来越高。GBase 8a MPP Cluster 支持 data 计算节点服务状态注册机制,data 计算节点定期主动向 gcware 管理集群中注册本地服务状态。
该机制可提高 data 计算节点状态监测 的准确性和时效性,降低少量计算节点异常对集群带来的影响。
Data 节点向 gcware 注册的信息用途包括:
1) Data 节点所属的 vc;
2) 用于 data 节点状态监测的长连接 sessionid 和节点 nodeid;通过注 册的 sessionid 跟踪 data 节点心跳,心跳中断后 gcware 管理集群设 置该 data 节点状态为异常;
3) 注册全局一致的重点参数取值,如 gbase_compression_str_method、gbase_compression_num_method 和 gbase_segment_size,同一个 VC 内的重点参数不一致时无法启动 data 计算节点的
服务。