PGconf.Aisa 2021 主题分享:Greenplum 数据的迁移与同步

61e8816c-55d9-4b49-9180-1247a6894e0c.jpg



2021年12月14日-17日,PostgresConf.CN & PGconf.Aisa 2021大会通过云端盛大召开。在大会上,来自Greenplum中文社区的技术专家阿福分享了《Greenplum数据迁移与同步》主题演讲。

bf885529-8452-43b3-91ac-1d2947da9947.png


本次《Greenplum数据迁移与同步》的主要演讲内容包含了四个部分,阿福 从工程的角度出发,阐述了在真实情况下将其他类型数据库迁移到Greenplum的过程,并在中间穿插了一些技术逻辑和建议。


  • Greenplum基础架构梳理

  • 数据迁移与同步逻辑

  • 如何从Oracle快速迁移数据

  • 如何有效校验数据一致性


首先,阿福带大家一起回顾了Greenplum的基础架构。Greenplum是基于PostgreSQL的开源分布式数据库,底层由一组组PostgreSQL实例作为基础元素。 当前的Greenplum数据库集群,对外提供唯一访问入口Master,相对于应用而言,Greenplum是一个统一的、功能完备的、标准SQL支持的、具有ACID特性的数据库; 在集群内部,Greenplum为了追求更好的分布式特性,做了大量优化,包括分布式死锁检测、网络层优化等,并提供一副本机制来保障数据库高可用。 限于本次分享主题为数据迁移与同步,阿福在第一部分演讲内容的最后带大家了解了Greenplum当前支持的数据入库方式,并向大家简单介绍了性能最好的gpfdist入库逻辑。

在熟悉了Greenplum整体架构后,阿福对生产数据迁移的过程进行了逻辑性阐述,整个过程分为8大部分,包括:


  1. 应用和数据库可迁移性评估;

  2. 规划迁移到Greenplum的过程;

  3. 模式转换:数据类型映射,表结构迁移;

  4. 函数/存储过程的迁移;

  5. 应用程序SQL语句适配;

  6. 迁移数据到Greenplum;

  7. 应用测试;

  8. 生产切换。

在分享的最后部分,分别进行了案例讲解及一致性校验逻辑的分享。案例讲解部分,介绍了通过copy方式进行数据迁移的小工具sqldata和通过sqluldr2+gpfdist从Oracle完成大容量数据迁移时的注意事项及执行步骤;一致性校验部分,介绍了数据校验的集中常用方法,其中一致性最高的校验方法当属MD5校验。


点击链接👇,观看完整演讲

a48f98ad-3517-4d7e-92c8-9bb62874a7f9.png e9f765dc-37e1-47f8-9660-6cca62564534.png



点击文末“ 阅读原文 ”,获取Greenplum中文资源。


84eea161-b5f0-44b4-bbf4-6d7f0874f02d.gif

e84d5873-a969-458f-883a-1156781e8a12.png 来一波 “在看”、“分享” “赞” 吧!


本文分享自微信公众号 - Greenplum中文社区(GreenplumCommunity)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“ OSC源创计划 ”,欢迎正在阅读的你也加入,一起分享。

Greenplum 集群之间同步数据方法及性能.....................................................................................1 1 概述.................................................................................................................................................2 2 相同集群相同数据库不同 SCHEMA 之间同步数据....................................................................2 2.1 查看原始表的大小行数与结构......................................................................................... 2 2.2 同步语句..............................................................................................................................2 2.3 查看 cpu 与内存的使用情况..............................................................................................3 2.3.1 查看 Master CPU 与内存使用情况.........................................................................3 2.3.2 查看数据节点的 CPU 使用情况..............................................................................3 2.3.3 查看数据节点的内存与磁盘使用情况..................................................................6 2.4 查看耗时与表的大小..........................................................................................................7 3 相同集群不同数据库之间同步数据.............................................................................................8 3.1 使用 pg_dum 方式同步数据..............................................................................................8 3.1.1 查看原始表的信息...................................................................................................8 3.1.2 把数据下载到磁盘...................................................................................................9 3.1.2.1 下载数据语句............................................................................................... 9 3.1.2.2 查看 Master 节点详细信息.........................................................................9 3.1.3 把数据导入到数据库中........................................................................................ 10 3.1.3.1 导入数据库语句......................................................................................... 10 3.1.3.2 查看 Master 节点的详细信息...................................................................11 3.1.3.3 查看数据节点的详细信息.........................................................................11 3.1.4 验证数据的准确性................................................................................................ 13 3.1.5 pg_dump 同步数据总结........................................................................................13 3.2 使用 dblink 同步数据........................................................................................................13 3.2.1 dblink 同步相同集群不同数据库数据.............................................................13 3.2.1.1 同步语句......................................................................................................13 3.2.1.2 查看 Master 节点的详细信息...................................................................15 3.2.1.3 查看数据节点的详细信息.........................................................................15 3.2.2 验证数据的准确性................................................................................................ 17 3.2.3 dblink 使用总结......................................................................................................17 3.3 使用 gptransfer 同步数据.................................................................................................17 3.3.1 gptransfer 介绍.......................................................................................................17 3.3.2 gptransfer 命令参数介绍.......................................................................................18 3.3.3 查看集群及硬件信息............................................................................................ 19 3.3.4 同集群之间同步数据............................................................................................ 19 3.3.4.1 查看表的详细信息..................................................................................... 19 3.3.4.2 进行表数据同步......................................................................................... 19 3.3.4.3 查看硬件详细信息..................................................................................... 21 3.3.4.4 查看数据的准确性..................................................................................... 23 3.3.4.5 使用 gptransfer 总结...................................................................................23 3.3.5 不同集群之间同步数据........................................................................................ 24
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值