大数据优化方案---Mysql中47G大表通过SQOOP导入数据仓库

针对47G的MyISAM大表,本文介绍了如何通过停止表功能、建立子表分批导入、使用SQOOP同步到数据仓库的全量和增量解决方案。详细步骤包括建表、数据分批插入、SQOOP执行语句等,旨在优化大数据迁移效率。
摘要由CSDN通过智能技术生成

目录

一、现状和需求

二、思路

三、注意事项

四、解决方案


一、现状和需求

现状
1、由于公司的Mysql表中有很多表的存储数量达几亿,单表达到40多个G,无法通过sqoop同步到数据仓库中。
2、mysql的引擎为【MyISAM】,表的索引只有 ID和Entid字段。
3、公司的Mysql表存储如下所示:
在这里插入图片描述
需求
1、需要对Mysql表进行特殊处理,达到通过sqoop同步到数据仓库的一张表【company】中。

二、思路

1、停止当前表的所有功能
2、全量快速方案:
       1)建立相同字段的表【table_000】到【table_XXX】;
       2)将大表按照索引均匀查出数据,分批插入到【table_000】到【table_XXX】

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

北京小辉

你的鼓舞将是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值