mysql分段更新_记一次MYSQL更新优化

在更新MySQL数据库时,遇到32w+条记录的批量更新慢的问题。通过分析发现,由于未正确使用联合索引,导致更新效率低下。通过分段更新和调整SQL语句,利用索引提高查询效率,最终将更新速度从每秒35条提升到30+次/s,大大缩短了更新时间。
摘要由CSDN通过智能技术生成

引言

今天(August 5, 2015 5:34 PM)在给数据库中一张表的结构做一次调整,添加了几个字段,后面对之前的数据进行刷新,刷新的内容是:对其中的一个已有字段url进行匹配,然后更新新加的字段type和typeid。后来就写了个shell脚本来刷数据,结果运行shell脚本后我就懵了,怎么这么慢~~~

情景再现

CREATE TABLE `fuckSpeed` (

`uin` bigint(20) unsigned NOT NULL DEFAULT 0,

`id` int(11) unsigned NOT NULL DEFAULT 0,

`url` varchar(255) NOT NULL DEFAULT '',

`type` int(11) unsigned NOT NULL DEFAULT 0,

`typeid` varchar(64) NOT NULL DEFAULT '',

......

KEY `uin_id` (`uin`,`id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

表结构大概是上面这样的(省略了好多字段),表中只有一个联合索引uin_id,而我在更新的时候是下面的思路:

首先根据一个id范围获取到一定数量的数据

select id,url from funkSpeed where id>=101 and id<=200;

遍历所有的数据,对每一条数据进行更新

#首先对数据进行处理,匹配获取type和typeid

update fuckSpeed set type=[type],typeid=[typeid] where id=[id]

按照上面的思路搞了之后,发现更新特别的慢,平均每秒钟35个左右,我也是醉了,我看看要更新的数据,总共有32w+条,这样更新下来大概需要24h+,也就是1天还要多,额~哭了,想想肯定是哪里出问题了。

发现问题

首先我想到的是是不是因为只有一个进程在更新,导致很慢,我启动了5个进程,将id分段了,就像下面这样

./update_url.sh 0 10000 &

./update_url.sh 10000 20001 &

./update_url.sh 20001 30001 &

./update_url.sh 30002 40002 &

./update_url.sh 40003 50003 &

运行之后发现还是那样,速度没有提升多少,还是每秒钟更新3~5个左右,想想也是啊,时间不可能花费在插入数据之前的那些步骤(匹配、组装sql语句、。。。),应该是插入的时候有问题

再来看看我的sql语句select id,url from funkSpeed where id>=101 and id<=200;,这里,试着在命令行执行了下,结果如下

mysql> select id,url from funkSpeed where id>=0 and id<=200;

Empty set (0.18 sec)

竟然花了0.18秒,这个时候我猜恍然大悟,联合索引我没有使用到,联合索引生效的条件是——必须要有左边的字段,用explain验证下,果然是这样:

mysql> explain id,url from funkSpeed where id>=0 and id<=200;

+-------------+------+---------------+------+---------+------+--------+-------------+

| table | type | possible_keys | key | key_len | ref | rows | Extra |

+-------------+------+---------------+------+---------+------+--------+-------------+

| funkSpeed | ALL | NULL | NULL | NULL | NULL | 324746 | Using where |

+-------------+------+---------------+------+---------+------+--------+-------------+

1 row in set (0.00 sec)

然后使用联合索引:

mysql> select uin,id from funkSpeed where uin=10023 and id=162;

+------------+----------+

| uin | id |

+------------+----------+

| 10023 | 162 |

+------------+----------+

1 row in set (0.00 sec)

mysql> explain select uin,id from funkSpeed where uin=10023 and id=162;

+-------------+------+---------------+----------+---------+-------------+------+-------------+

| table | type | possible_keys | key | key_len | ref | rows | Extra |

+-------------+------+---------------+----------+---------+-------------+------+-------------+

| funkSpeed | ref | uin_id | uin_id | 12 | const,const | 4 | Using index |

+-------------+------+---------------+----------+---------+-------------+------+-------------+

1 row in set (0.00 sec)

可以看到几乎是秒查,这个时候基本可以断定问题是出现在索引这个地方了

我select的时候次数比较少,每两个select之间id相差10000,所以这里可以忽略掉,而且这里没办法优化,除非在id上面添加索引。

问题发生在update fuckSpeed set type=[type],typeid=[typeid] where id=[id],这里在更新的时候也是会用到查询的,我的mysql版本是5.5,不能explain update,不然肯定可以验证我所说的,这里要更新32w+条数据,每条数据都会去更新,每条数据0.2s左右,这太吓人了~~

解决问题

问题找到了,解决起来就容易多了~~

select的时候加了一个字段uin,改为下面这样select uin,id,url from funkSpeed where id>=101 and id<=200;,然后更新的时候使用update fuckSpeed set type=[type],typeid=[typeid] where uin=[uin] id=[id],这样一来索引就是用上了。

三下五除二改好了代码,试着启动了一个进程,看看效果如何,果然,效果提升的不是一点点,平均30+次/s,这样大概3个小时左右就可以完成所有的更新了。

微信号: love_skills

越努力,越幸运!越幸运,越努力!

做上CEO不是梦

赢取白富美不是梦

屌丝逆袭不是梦

就是现在!!加油

6eff51eb4ec35de0485d869d0af010ac.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值