记一次Mysql大批量数据更新

背景

因公司业务架构变更,需要对原有账户累计收益进行备份,削弱老业务对新业务的影响。而原有用户累计收益数据约为7000w,因为处于业务过渡阶段,所以希望以一种临时的手段去存储数据,最终讨论得出,在用户表新增一个字段old_balance来存储这个数据。

大表加字段

在这里插入图片描述
从图中看到,member表数据空间占用11.12G。另外也发现索引占用的空间比数据还大,可见索引的创建需要慎重。

一开始以为加字段会锁表,使得线上服务不可用。但后来发现是不需要的。
Mysql支持在增加列的过程中并发DML。
在这里插入图片描述
Mysql5.6官方文档 https://dev.mysql.com/doc/refman/5.6/en/innodb-online-ddl-operations.html#online-ddl-column-operations

大致流程是:重建临时表,数据拷贝到临时表中,然后删除原表,将临时表的表名更改为原表。
可惜,十几个G的member大表增加bigInt字段,花了两个多小时,最终算是成功了,有惊无险。

批量数据更新

需要更新的数据是通过原有接口获取的,然后再更新到member表中,虽然一条数据花费时间不会很久,但当数据量到千万级,累计起来还是很可观的。

相信很多同学都想到了,并行执行

如果单线程执行,更新一条数据大于20ms,则7000w * 20ms / 1000 * 86400 约等于16天,为了尽快完成任务,推动账户迁移项目的进度,
我就加大线程数,将数据加到线程池中处理,一开始单机起了40个线程,处理速度还是太慢。

然后线程数40 -> 逐步改成了400,批量处理速度的确比较快,1分钟能处理10w数据。
但一看数据库:
在这里插入图片描述
cpu已经飙到了100%,线上系统也出现了告警

后来发现,这除了和并行执行有关,还和分页查询的性能有关。

类似于对全量数据的分页扫描,可以采用主键Id进行分页,如:

select * from tableName where id between (pageNo-1)*pageSize and pageNo*pageSize;

不要使用

// 随着数据量的增多,limit后面会越来越大,性能急剧降低,损耗性能
select * from tableName order by id limit (pageNo-1)*pageSize ,pageSize;

这种方法,随着数据量的增多,limit后面会越来越大,扫描的数据越来越大,性能急剧降低,损耗性能

小贴士
select * from tableName order by id limit pageSize offset (pageNo-1)*pageSize;
等价于
select * from tableName order by id limit (pageNo-1)*pageSize ,pageSize;
都表示从(pageNo-1)*pageSize开始往后查找pageSize个

所以后来修改了查询sql,同时根据Mysql压力情况调整并发线程数。

使得CPU控制在安全范围内。
在这里插入图片描述

小结

批量处理超大数量的数据,我们会考虑使用多线程。同时需要考虑系统的性能状况合理控制并发度。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MySQL 大批量数据查询可以通过一些优化技巧来提高查询性能。首先,可以使用索引来加快查询速度。在表中创建适当的索引,可以减少数据库的扫描量,从而提高查询效率。其次,可以使用合适的查询语句来减少数据传输量。例如,可以使用SELECT语句的LIMIT子句来限制返回的结果集大小,避免一次性返回过多的数据。此外,还可以使用分页查询来分批获取数据,减少单次查询的数据量。另外,还可以考虑使用流式查询来处理大批量数据。在Mybatis中,可以设置fetchSize为-2147483648来实现流式查询,从而避免一次性加载全部数据到内存中。这样可以减少内存的占用,并提高查询的效率。总之,通过合理使用索引、优化查询语句和使用流式查询等技巧,可以提高MySQL大批量数据查询的性能。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* [mysql 处理 多条件 大批量数据 查询](https://blog.csdn.net/weixin_30848953/article/details/113256670)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [MySQL数据量查询方案](https://blog.csdn.net/qq_19922839/article/details/126411574)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值