大数据集群迁移方案

最新推荐文章于 2024-04-23 17:06:15 发布

Kevin_鹿

最新推荐文章于 2024-04-23 17:06:15 发布

阅读量2k

点赞数

分类专栏：大数据集群迁移数据中台大数据文章标签：大数据分布式 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kevin__Durant/article/details/110006466

版权

大数据同时被 3 个专栏收录

15 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

大数据集群迁移

1 篇文章 0 订阅

订阅专栏

背景

当前集群满足不了日益增长的业务量级，并且需要一套全新集群，并且后续的扩充依据新集群展开，此次集群迁移是将所有数据，服务，业务线全部迁移，围绕着新老集群展开，老集群保证线上无误的情况下进行迁移，具体细则展开在下文以及后续；

整体规划

新集群重装，涉及的量比较大，优化等等；
保证线上与新集群同时运行；
数仓迁移，HBase数据迁移，部门之间调用配置修改等；
中间件集群不变，但是机架更换只与服务有关；
服务迁移；

集群搭建

按照原服务无改变，不包含中间件ES，Druid，Clickhouse，neo4j，Superset；

在这里插入图片描述

数据迁移

数仓数据迁移；
- Max Well开启后关闭记录实时业务库偏移量，迁移HDFS数据，只需要迁移ODS、DIM、DM数据即可，迁移完成后部署项目，建表，部署RDS，DW等；
- 具体过程
  1. 保证线上不动；
  2. 开启新集群MaxWell并关闭，记录偏移量；
  3. 开启Streaming记录偏移量；
  4. 开始进行HDFS数据迁移，使用Hadoop内部命令即可；
  5. 开启MaxWell、Streaming；
  6. 部署数仓；
HBase数据迁移；
- HBase接入实时流并关闭记录偏移量，导入HBase虚拟快照与HDFS，开启实时流；

服务迁移

变量系统、数据平台、乾坤等按照不同业务属性进行迁移，具体用展开，保证上下游没有问题即可；

其他迁移

Druid元数据及冷数据迁移；
Azikaban服务迁移；
Superset元数据迁移；

冷数据迁移；

Azikaban服务迁移；
Superset元数据迁移；

----持续更新

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。