备份与恢复
备份恢复操作概述
关于并行备份(gp_dump)
1) GP同时备份Master和所有活动的Segment实例
2) 备份消耗的时间与系统中实例的数量没有关系
3) 在Master主机上备份所有DDL文件和GP相关的数据字典表
4) 每个Segment备份各自的数据
5) 所有备份文件组成一个完整的备份集合,通过唯一14位数字的时间戳来识别
关于非并行备份(pg_dump)
1) GP依然支持常规的PostgreSQL备份命令pg_dump和pg_dumpall
2) 备份将在Master主机上创建一个包含所有Segment数据的大的备份文件
3) 不适合于全部数据备份,适用于小部分数据的迁移或备份
关于并行恢复(gp_restore)
1) 通过gp_dump产生的时间戳来辨识备份集合,恢复数据库对象和数据到分布式数据库中
2) 每个Segment并行恢复各自的数据
3) 被恢复的GP系统必须与备份的系统同构
关于非并行恢复(pg_restore)
1) 使用由pg_dump或pg_dumpall创建的备份文件来恢复
2) 使用非并行恢复可以实现异构系统恢复
备份数据库
备份数据库的四种选择
1) 为每个实例创建一个备份文件
可用于全库备份或者相同配置的系统之间迁移数据;
2) 使用gpcrondump进行定期备份
对gp_dump进行包装,使用cron调度GP数据库的后台进行备份;
调用gpcrondump的调度作业应该部署在GP的Master主机;
gpcrondump命令还备份数据库角色和服务器配置等数据