https://zhuanlan.zhihu.com/p/101997282
知识点:
linux查看缓存命令free -mh
清除缓存命令sync; echo 3 > /proc/sys/vm/drop_caches
总结为什么join语句是相对比较耗费性能?
1、join_buffer_size:在执行join语句的时候必然要有一个比较的过程,逐条比较两个标的数据是比较慢的,我们可以把数据一次读进内存块中,innoDB引擎可以使用show variables like ‘%buffer%’查看可用内存join_buffer_size的大小,所当数据量较小时可以把数据全部放进缓存中使用join语句,但是join_buffer_size的大小会影响到join语句的性能
2、磁盘:如果不使用join_buffer_size,那么因为在硬盘中每个表都是一个文件,每使用一次join语句就会使硬盘磁头移动一次,频繁的移动磁头会影响性能,另外操作系统对数据会有缓存机制,存储器的层级结构本质是,每一层的存储设备都是较低一层设备的缓存,所以存储器的缓存空间对join语句也有影响
3、算法:
3.1、有索引时,直接读取两个表的索引树进行比较
3.2.没有索引时、Nested Loop Join(循环嵌套,每次读取一行数据进行对比,复杂度:n*n)、Block nested loop(块嵌套循环,把数据放到内存,减少I/O开销,是innoDB没有索引时默认的算法)
总结
上学时,数据库老师最喜欢考数据库范式,直到上班才学会一切以性能为准,数据表能冗余就冗余,实在冗余不了的就join如果join真的影响到性能。试着调大你的join_buffer_size, 或者换固态硬盘