mysql 千万数据迁移的几种方式

最近因为业务需求,我们需要将我们的订单表(一千三百万数据,并且每天已五万条速度增加)已订单类型分组迁移到新的业务表中,以降低我们订单表的大小,同时暂时杜绝订单表所带来的数据瓶颈问题,需求下来了,基本思路也要确定下来,我打算先将三天前的历史数据先跑到表里,待整个业务线迁移过后,我再将剩下的数据跑进去,思路确立了,我就轰轰烈烈的干了起来。

首先我理所当然的想用代码实现,我就吭哧吭哧的用go写了是个协程同时跑数据,用gorm v2的FindInBatches可以批量插入数据,sql为insert into XXX(字段) values (数据1,数据2)这样,中间遇到一个问题,我想可以快点结束,就用了分页查询,每次5000条,每个对象包含四十个字段,结果就报错Prepared statement contains too many placeholders,占位符太多,mysql一条语句最多支持65535,然后我就修改为1500条每次,刚开始确实很快,但是越到后面就发现分页查询到几秒、几十秒最后基本跑不下去了,这种方案分页查询太慢,pass。

接着我就直接在sql里面跑,用insert into XXX(字段1,字段2…) form select 条件,以前我跑百万数据的时候就用的这个语句,需要注意的是,select 查询的时候一定记得要给查询条件加上索引,避免全表扫描。因为全表扫描会导致数据加锁,数据量太多会让数据读写均无法操作,切记,一定要加索引,这种方案可以正常导入,但是时间比较长,有全表加锁的风险,慎用。

再然后我使用的是阿里云的数据湖分析工具(DLA,功能强大,强烈推荐),将我们的历史数据先导下来,然后使用load data快速导入数据的方法去导入数据,这个方法有个弊端就是需要将数据(文件较大)上传到服务器,并且需要是宿主机上,但是速度真的是很快,我选择的是这种方式导入数据,方便快捷。

最后一种就是下载指定字段的dump文件,然后进入到数据库用source命令将我们的dump文件执行就OK了,en…速度不敢恭维

以上几种方式,小数据量的迁移可以选择代码(只要为了锻炼写代码能力)或者insert into select from,中数据量的可以使用mysqldump去迁移数据,大数据量还是推荐使用load data快速导入的方式去迁移数据。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MySQL 是一款广受欢迎的开源关系型数据库管理系统(RDBMS),由瑞典MySQL AB公司开发,现隶属于美国甲骨文公司(Oracle)。自1998年首次发布以来,MySQL以其卓越的性能、可靠性和可扩展性,成为全球范围内Web应用程序、企业级解决方案以及其他各种数据处理场景的首选数据库平台之一。 以下是对MySQL数据库的详细介绍: 核心特性与优势 开源与跨平台 MySQL遵循GPL开源协议,这意味着任何人都可以免费下载、使用和修改其源代码。这种开放性促进了广泛的社区支持和第三方插件、工具的发展。此外,MySQL支持多种操作系统,包括Windows、Linux、macOS、Solaris等,确保了其在不同环境下的兼容性和部署灵活性。 关系型模型与SQL支持 MySQL基于关系型数据库模型,数据以表格形式组织,并通过预定义的键(如主键、外键)在表之间建立关联。它完全支持结构化查询语言(SQL),允许用户进行数据查询、插入、更新、删除、创建和管理数据库结构等操作。SQL标准的广泛支持使得MySQL易于学习,且与其他关系型数据库系统有良好的互操作性。 存储引擎 MySQL支持多种存储引擎,如InnoDB、MyISAM、MEMORY等,每种引擎都有特定的优势和适用场景。例如,InnoDB提供事务安全、行级锁定和外键约束,适合处理高并发事务性的应用;MyISAM则更侧重于读取密集型操作,提供全文索引支持,适用于读多写少的场景。这种多引擎架构使得MySQL能够适应不同业务需求,提供高度定制化的存储解决方案。 性能与可扩展性 MySQL通过高效的缓存机制、查询优化器以及对硬件资源的有效利用,保证了在高负载情况下的稳定性和速响应。它支持水平扩展(如通过分片、复制等技术)和垂直扩展(如增加硬件资源),以应对大规模数据存储和高并发访问的需求。 安全性与管理工具 MySQL提供了一系列安全措施,如用户账户管理、访问权限控制、SSL/TLS加密连接、审计日志等功能,确保数据的安全性和合规性。同时,MySQL附带了一系列管理工具,如MySQL Server、MySQL Workbench、MySQL Shell等,便于用户进行数据库配置、监控、备份、恢复、迁移等工作。 社区与生态系统 MySQL拥有庞大的开发者社区和丰富的第三方插件、库、中间件支持,提供了丰富的文档、教程、论坛以及专业服务,极大地简化了开发、运维和故障排查过程。 关键组件与日志 系统数据MySQL内部包含几个特殊的系统数据库,如: information_schema:提供关于所有数据库、表、列、索引等元数据信息,是查询数据库结构的标准接口。 mysql:存储MySQL自身的系统信息,如用户权限、服务器配置、事件调度等。 performance_schema:自MySQL 5.5版本引入,用于收集服务器性能数据,帮助诊断和优化系统性能。 test(非必要):默认提供的测试数据库,通常用于学习和实验,生产环境中可考虑删除。 sys(自MySQL 5.7版本):提供更易用的视图来访问performance_schema中的信息,简化性能分析工作。 日志文件 MySQL通过日志记录来保证数据一致性、支持故障恢复和审计需求,主要包括: 错误日志(Error Log):记录MySQL服务器运行期间的严重错误、警告和其他重要事件。 二进制日志(Binary Log,binlog):记录对数据库进行数据更改(如INSERT、UPDATE、DELETE)的操作序列,用于数据复制和恢复。 查询日志(query log):可选地记录所有发送到MySQL服务器的SQL查询,用于调试和审计。 慢查询日志(slow query log):记录执行时间超过指定阈值的查询,帮助识别和优化性能瓶颈。 应用场景 MySQL广泛应用于各种规模和类型的项目,包括但不限于: Web应用程序:作为众多网站和Web服务(如电子商务、社交媒体、内容管理系统等)的后台数据库。 数据分析与报表:与数据仓库技术结合,支持OLAP(在线分析处理)和数据可视化。 移动应用与物联网(IoT):作为数据存储层,支撑大量设备的数据采集、存储和查询需求。 嵌入式系统:在资源有限的环境中,作为轻量级数据库解决方案。 总之,MySQL凭借其开源、跨平台、高性能、灵活扩展、丰富功能集和庞大社区支持等特点,成为现代数据管理领域中不可或缺的一部分,适用于各种行业和业务场景的数据库需求。
MySQL 翰高数据迁移是指将现有的MySQL数据迁移或复制到翰高数据库系统中。翰高数据库是一种基于MySQL的企业级数据库解决方案,可以提供更高的性能、可靠性和扩展性。 在进行MySQL翰高数据迁移时,需要注意以下几个步骤: 1.备份数据:在迁移之前,首先要对原有的MySQL数据库进行数据备份,以防止数据丢失或损坏。可以使用MySQL自带的工具或第三方工具进行备份。 2.安装翰高数据库:在迁移之前,需要先在目标服务器上安装翰高数据库。翰高数据库是一种高性能、高可用性的数据库,在安装过程中需根据实际情况进行配置。 3.迁移数据:将备份好的MySQL数据导入到翰高数据库中。可以使用翰高数据库自带的工具或第三方工具,如DataLoader等,将数据从备份文件导入到翰高数据库中。 4.验证数据:在迁移完成后,需要对数据进行验证,确保迁移过程中数据的准确性和完整性。可以使用一些SQL查询语句或工具对数据进行验证。 5.测试应用:在数据迁移完成后,需要对应用程序进行测试,确保其能够正常运行并与新的翰高数据库进行交互。 总之,MySQL翰高数据迁移是一个关键的过程,需要进行充分的备份和验证工作,以确保数据的安全和完整性。同时,还需要进行应用测试,以确保应用程序与新的翰高数据库能够正常工作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值