近期发现集群中有台MySQL服务器出现cpu消耗奇高的怪现象,最后分析得知因为selectsum(a) from b where UNIX_TIMESTAMP(c)>d and UNIX_TIMESTAMP(c)<e这个语句引起的。
尽管对类型为datetime的c字段做了主键索引设计,但发现上述语句执行时全表遍历。上述b表总共2500万条记录,并且全部数据在缓存中,运行却需要7分钟左右,即每秒钟只能遍历2500/7/60=6万条内存数据记录,可谓非常之慢。
后来分析mysql的源代码得知UNIX_TIMESTAMP()是需要把结构体表示的datetime类型采用localtime()函数转换成utc时间,而localtime是一个性能极差的函数,经测试一台标配服务器多线程耗尽全部cpu只能每秒处理30万次的样子。而上述的sql语句中两次处理c,每次处理里面需要两次localtime函数调用,即6*2*2=24万次每秒调用localtime就是耗尽cpu的元凶。
故而:
1.数据库设计尽可能把datetime和timestamp改为bigint类型,避免使用UNIX_TIMESTAMP();
2.所有程序中要慎用localtime()函数,因为它耗尽所有cpu也只能达到每秒30万次,是一个性能极低的系统函数。