数据库——sql优化（百万数据优化方案）

最新推荐文章于 2024-08-03 04:17:53 发布

扶公瑾以苏

最新推荐文章于 2024-08-03 04:17:53 发布

阅读量1.6k

点赞数 2

分类专栏：后端文章标签： sql 优化

本文链接：https://blog.csdn.net/qq_36470686/article/details/84778875

版权

本文探讨了数据库优化的各种策略，包括索引优化、分库分表分区、数据库引擎选择、预处理和读写分离。针对SQL语句的具体操作，提供了25条优化建议，强调了避免全表扫描、合理使用索引、减少数据访问和交互次数等原则。此外，解释了为何B+树更适合实际应用中的文件索引和数据库索引，最后给出了实际的优化案例，涉及数据插入、排序、分组、嵌套查询、OR条件、分页和SQL提示的优化技巧。

摘要由CSDN通过智能技术生成

一、sql数据库优化

1、索引

建立索引是数据库优化各种方案之中成本最低，见效最快的解决方案，一般来讲，数据库规模在几十万和几百万级别的时候见效最快，即便是有不太复杂的表关联，也能大幅度提高sql的运行效率。

建立索引需要注意的地方

1、索引一般加在查询条件的关键字上，如果有多个查询条件关键字，还可以添加组合索引，写sql的时候需要注意，索引字段和sql字段需要保持一致，否则索引会无效。

2、建立索引的字段要区分度比较高，比如user表中有一个性别字段，性别字段无非男女两种值，区分度不好，建立索引效果不好，要选择区分度高的字段

3、建立组合索引，可以持续提升sql运行效率，但是也不要盲目，同样的要注意区分度，如果区分度不够高，就不要加了，多个字段，尽可能把区分度高的字段放在前面，另外，还要注意索引长度，这个索引要同时兼顾索引长度和区分度的平衡

4、索引会大幅提升查询效率，但是也会损耗查询后修改效率，要注意兼顾平衡，使用在一次插入，多次查询的表上效果最好，同时要注意的是，组合索引会不可避免的增加索引长度，会增加索引存储空间，注意索引长度和区分度平衡

5.并不是所有索引对查询都有效，SQL是根据表中数据来进行查询优化的，当索引列有大量数据重复时，SQL查询可能不会去利用索引

6.索引并不是越多越好，索引固然可以提高相应的 select 的效率，但同时也降低了 insert 及 update 的效率，因为 insert 或 update 时有可能会重建索引，所以怎样建索引需要慎重考虑，视具体情况而定。一个表的索引数最好不要超过6个，若太多则应考虑一些不常使用到的列上建的索引是否有必要。

7.在使用索引字段作为条件时，如果该索引是复合索引，那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引，否则该索引将不会被使用，并且应尽可能的让字段顺序与索引顺序相一致。

MySQL索引实现

MyISAM索引文件和数据文件是分离的，索引文件仅保存数据记录的地址。因此，MyISAM中索引检索的算法为首先按照B+Tree搜索算法搜索索引，如果指定的Key存在，则取出其data域的值，然后以data域的值为地址，读取相应数据记录。而在InnoDB中，表数据文件本身就是按B+Tree组织的一个索引结构，这棵树的叶结点data域保存了完整的数据记录。

MyISAM的索引方式也叫做“非聚集”的

2、分库分表分区

索引适合应对百万级别的数据量，千万级别数据量使用的好，勉强也能凑合，但如果是上亿级别的数据量，索引就无能为力了，因为单索引文件可能就已经上百兆或者更多了，那么，轮到的分表分区登场了

分库

可以按照业务分库，分流数据库并发压力，使数据库表更加有条理性。可以把查询库和系统库(增删改比较频繁的表)分开了，这样如果有大查询，不影响系统库

分表的方法

1、如果这个业务是有流程的，那么我们通常会设计一个历史表或者归档表，用来存放历史数据，这样能保证实时数据效率比较高

2、针对某一张大表，可以根据查询条件分成多张表，比如时间，我们可以将半个月或者10天的数据放到一张表里(看具体数据量，个人认为3000W是个上限，最好控制到百万级别)，每过10天，我们就自动创建一张数据库表，然后将数据插入，如此，按照时间查询，就要先定位去那种表中去取数，这样，效率能够得到大幅度提升.

当然，这么解决也有问题，比如跨表，需要union多张表，而且跨表没法支持索引

3、一般来讲，数据库中的大表毕竟只是一少部分，仅需要对这少部分大表进行分表就可以了，没必要小表也进行分表，增加维护开发难度