Mysql删除千万级数据的方案

最新推荐文章于 2024-08-02 22:16:19 发布

背影的奋斗

最新推荐文章于 2024-08-02 22:16:19 发布

阅读量1.5k

点赞数 1

文章标签： mysql 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zliang2010/article/details/130343456

版权

记录一次Mysql删除千万级数据的方案

背景：有个项目跑了一年多，没注意过，结果有一天看了下，最大的mysql表居然有四千万数据了。
震惊！自己挖下的坑还要自己坑。
因为这个表中有查询，有排序，有更新操作，如果是纯插入可能会很多，有更新和查询，四千万的表有点夸张了。所以着手进行删除。

当下最火的是chatgpt。人工智能。号称取代程序猿。于是把这个问题抛给了gpt。
gpt告诉我delete from table where id<35000000 and xxx is not null。就行了。于是，脑子一抽直接执行了。
之前我也有过类似的操作，所以就执行了。跑了十几分钟，然后就去睡觉了。

一觉醒来，同事告诉我线上很卡，我慌了，瞬间清醒。看了线上的sql 连接，
SELECT
*
FROM
information_schema.PROCESSLIST。
发现有个update耗时特别长，仔细一看就是昨天执行的delete操作，瞬间慌了。想着赶紧先停掉吧。
于是继续头脑发蒙，问gpt怎么停掉，gpt告诉我kill就行，于是我就执行了kill connectid，没想到脑残了。
继续查看sql连接，发现还是在执行中，只是变成了kill中，只能继续问gpt。

gpt告诉我mysql会回滚kill的连接操作。我瞬间炸毛了。跑了一晚上删除了一千万的数据，这kill一下，要全部回滚。疯了。

继续查询如何kill掉这个kill，然后gpt和网上很多说法是要修改回滚的设置，我一想算了，摆烂吧。线上只是卡慢，要是出问题就废了。

于是第三天，终于kill的链接没了。查了一下数据，还是很多，还得想办法。网上说了很多办法，复制表之类的，但是都有业务停顿。

仔细分析原因，上面的执行速度慢，其实是因为where条件慢，即使加了limit也不行，数据太大，每次where的执行效率太慢，于是乎突发奇想，不如直接delete xxx where id=xxx，试了一下，这样可以。
于是乎，因为id是自增的，我知道最大值，只需要生成删除脚本就可以了。生成了个删除三千万行的脚本，2G，zip压缩一下，100M，压缩效率真是高。

于是乎source 执行这个脚本，挺好的，没想到睡了一觉，发现没有后台执行，本以为是可以后台执行的。

继续查询，这个时候gpt不给力了。经常卡断。于是百度，nohup 吧，nohup说了后台执行，日志输出不太对，没当回事，因为上面mysql客户端执行的时候日志是正常的，于是nohup就执行了，没想到nohup之后，日志没有输出，听天由命吧。看了下mysql链接，已经不断的在删除数据了。
这样最起码不会回滚了。听天由命。

只是这样业务不中断。有好办法欢迎留言讨论。

背影的奋斗

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
3
评论
Mysql删除千万级数据的方案

于是百度，nohup 吧，nohup说了后台执行，日志输出不太对，没当回事，因为上面mysql客户端执行的时候日志是正常的，于是nohup就执行了，没想到nohup之后，日志没有输出，听天由命吧。仔细分析原因，上面的执行速度慢，其实是因为where条件慢，即使加了limit也不行，数据太大，每次where的执行效率太慢，于是乎突发奇想，不如直接delete xxx where id=xxx，试了一下，这样可以。背景：有个项目跑了一年多，没注意过，结果有一天看了下，最大的mysql表居然有四千万数据了。
复制链接

扫一扫

背影的奋斗 CSDN认证博客专家 CSDN认证企业博客

码龄12年

35: 原创

14万+: 周排名

3万+: 总排名

13万+: 访问

: 等级

1276: 积分

42: 粉丝

67: 获赞

11: 评论

101: 收藏

私信

关注

热门文章

分类专栏

mysql 1篇
maven 1篇
文档 1篇
安卓 1篇
JAVAFX 1篇
Java 21篇
Java Web 5篇
数据库 1篇
前端显示 2篇
设计思想 1篇
DB2
系统问题解决 2篇
工具类 4篇
eclipse集成 4篇
心情随笔 5篇
spring 5篇
定时任务 1篇
redis 1篇
Linux 2篇
IDEA 1篇

最新评论

Mysql删除千万级数据的方案
weixin_63306535: 备份了表，然后直接truncate，后面从备份表里按条件筛选查询需要的数据放到新建的表里，这样比较快
Mysql删除千万级数据的方案
背影的奋斗: 有结果吗，最后怎么删除的。我觉得按序对主键删除还是挺稳定的，现在我都是这样删除的。还搞了个定时任务
Mysql删除千万级数据的方案
weixin_63306535: 我看到你这篇文章的时候，正在执行删除一个有一亿七千万条数据的表，十一点半执行的，现在三个多小时了，我想终止，然后脚本放后台执行，看到你的经历，我放弃了，看到另外一个大佬，说导出要保留的数据，备份，然后truncate，明天试一试
Ubuntu 20 安装redis，单节点
Hello_Andrw: 亲测成功，厉害
AMD机器安装Android studio环境安装
干坏事p过: （自动评论）前排支持一下,可以的话来我博客看看吧

大家在看

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。