gbase迁移mysql_基于datax实现从gbase到mysql的数据迁移--时间字段篇

最新推荐文章于 2024-05-28 13:27:30 发布

与绾

最新推荐文章于 2024-05-28 13:27:30 发布

阅读量913

点赞数

文章标签： gbase迁移mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31621945/article/details/113271982

版权

本文介绍了如何使用DataX从GBase迁移到MySQL，特别是针对大表且时间字段与记录数差异大的情况，通过时间字段进行切片迁移。详细阐述了迁移策略和具体实现脚本，包括数据抽取、转换和加载的过程。

摘要由CSDN通过智能技术生成

项目背景

前期已经写过几篇用datax实现异构数据迁移的文章，面对复杂的上游数据，无法用一种通用的方式来实现所有业务表的迁移，比如一个大业务表中rowid字段与表记录差异特别大(一个表有3亿条记录，里面的最大rowid为30亿)，这种情况下通过rowid切片也能实现迁移，但切片后的数据分布不均匀，这时基于时间字段来迁移则要顺利得多。

系统环境

gbase8a 16节点集群

mysql5.6.46主从

迁移策略

迁移数据有几种方式，需要根据实际的情况来决定采用哪一钟，面对复杂的业务数据，很难有标准的方式来实现所有业务数据的迁移，现把我遇到的迁移策略整理如下：

1、对于小表(百万级)进行批量迁移

2、大表无时间字段(千万以及亿级)，通过rowid字段切片

3、大表有时间字段，但rowid比表记录大几倍甚至几十倍的情况，基于时间字段切片迁移

通过几上三种方式组合，完美的解决了目前项目遇到的数据迁移问题

实现脚本

datax配置文件

{

"job": {

"setting": {

"speed": {

"byte": 1048576

},

"errorLimit": {

"record": 0,

"percentage": 0.02

}

},

"content": [

{

"reader": {

"name": "$source_reader",

"parameter": {

"username": "$source_db_user",

"password": "$source_db_pwd",

"connection": [

{

"querySql": [

"select * from $source_table_name where $date_

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。