mysql innodb insert_MySQL innodb load data.vs.insert 前因后果

最新推荐文章于 2024-03-18 11:53:28 发布

刘良运

最新推荐文章于 2024-03-18 11:53:28 发布

阅读量119

点赞数

文章标签： mysql innodb insert

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42659194/article/details/113429504

版权

前一段时间接了个业务比较特殊，它的场景是这样的：

–每天入库数据量3亿左右

–写多读少，每隔5分钟写入10w数据

–按天分表，多年同一天的数据在一个表里

–同一天的数据每隔5分钟更新一次

–数据来源，经过Hadoop分析过后的csv文件

--类似于这样的，会有并发同时跑，但是数据量和间隔时间不一样

数据库配置：普通sas盘，24G内存，16核CPU，单实例，1主1备

优化前的做法是:

1. 把原来的前几分钟的数据根据日期delete掉

2. 使用程序读取分析过的csv文件，拼装成insert into tbname (col1,col2,......) values (val1,val2,....,),(val3,val4,.......,),.......;

存在问题：

1. 主库写入太慢最长的一个表插入时间要329分钟

2. 备库延迟太大(>20w秒)，慢查询文件很大16G，存在单点故障

效率图：

优化做法：

把insert换成load

优化成果:

CPU消耗情况：

io情况有所好转，但是iowait仍然严重，因为本来就是io bound型，虽然减少了大部分记录慢日志的io,其他io情况，没有像写入效率那么明显。

备库没有延迟，解决了单点故障

原因：

MySQL手册里已经说得很清楚:

1. 关掉自动提交

2. 禁掉唯一索引

3. 禁掉外键

这样能节省大量物理io

原因：

load data跳过sql解析，直接生成数据文件;

load data在导入之前会关掉索引，导入完成后更新索引；

load data开始执行后占用的内存空间不会被purge掉

另外load data的速度和文件每行的大小有关，每行所占的字节数越少，load的速度越快；同样的前提，没有索引的要比有索引的要快；

如何提高插入表的效率，欢迎移步： http://www.informit.com/articles/article.aspx?p=377652&seqNum=4

http://www.innodb.com/doc/innodb_plugin-1.0/innodb-create-index.html

http://www.mysqlperformanceblog.com/2008/04/23/testing-innodb-barracuda-format-with-compression/

http://www.mysqlperformanceblog.com/2008/07/03/how-to-load-large-files-safely-into-innodb-with-load-data-infile/

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
mysql innodb insert_MySQL innodb load data.vs.insert 前因后果

前一段时间接了个业务比较特殊，它的场景是这样的：–每天入库数据量3亿左右–写多读少，每隔5分钟写入10w数据–按天分表，多年同一天的数据在一个表里–同一天的数据每隔5分钟更新一次–数据来源，经过Hadoop分析过后的csv文件--类似于这样的，会有并发同时跑，但是数据量和间隔时间不一样数据库配置：普通sas盘，24G内存，16核CPU，单实例，1主1备优化前的做法是:1. 把原来的前几分钟的数据根...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。