目录
一、现状和需求
二、思路
三、注意事项
四、解决方案
一、现状和需求
现状
1、由于公司的Mysql表中有很多表的存储数量达几亿,单表达到40多个G,无法通过sqoop同步到数据仓库中。
2、mysql的引擎为【MyISAM】,表的索引只有 ID和Entid字段。
3、公司的Mysql表存储如下所示:
需求
1、需要对Mysql表进行特殊处理,达到通过sqoop同步到数据仓库的一张表【company】中。
二、思路
1、停止当前表的所有功能
2、全量快速方案:
1)建立相同字段的表【table_000】到【table_XXX】;
2)将大表按照索引均匀查出数据,分批插入到【table_000】到【table_XXX】