由于之前把Ubuntu系统搞崩了,所以之前已经导入的GHTorrent数据集又得重新导入,发现copy to tmp table的时间特别长,想了想自己之前已经设置了tmp_table_size,但仔细搜索了一下,发现为了解决这个问题,仅仅设置这一处是不对的,例如这里讨论的:https://dba.stackexchange.com/questions/7806/copying-to-tmp-table-extremely-slow
应该还同时设置max_heap_table_size,例如这里也介绍的:
https://www.cnblogs.com/cyt1153/p/6801212.html
copy to tmp talbe 语句产生的原因是查询需要Order By 或者Group By等需要用到结果集时,参数中设置的临时表的大小小于结果集的大小时,就会将该表放在磁盘上,这个时候在硬盘上的IO要比内销差很多。所耗费的时间也多很多。另外Mysql的另外一个参数max_heap_table_size比tmp_table_size小时,则系统会把 max_heap_table_size的值作为最大的内存临时表的上限,大于这个时,改写硬盘。
所以综合考虑下,加之参考这里的设置:
https://www.cnblogs.com/weiwang/p/5649146.html
最后设置如下:
tmp_table_size = 600M
max_heap_table_size = 1024M
就暂时总结这么多。