1万条数据大概占多大空间_MySQL 百万级数据量查询方法及其优化

最新推荐文章于 2024-05-28 10:14:32 发布

weixin_39616056

最新推荐文章于 2024-05-28 10:14:32 发布

阅读量3.1k

点赞数 1

文章标签： 1万条数据大概占多大空间 word2vector数据集样式数据量大避免递归

本文介绍了MySQL中处理大数据量分页查询的多种方法，包括直接使用LIMIT、建立索引、使用ORDER BY、PREPARE语句等，并通过实验展示了不同方法的性能对比。重点探讨了利用覆盖索引和复合索引进行优化，以提高查询效率。

摘要由CSDN通过智能技术生成

点击上方“Python全家桶”，“星标”或"置顶"

关键时刻，第一时间送达

链接：www.cnblogs.com/geningchao/

p/6649907.html

方法1: 直接使用数据库提供的SQL语句

语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 LIMIT M,N
适应场景: 适用于数据量较少的情况(元组百/千级)
原因/缺点: 全表扫描,速度会很慢且有的数据库结果集返回不稳定(如某次返回1,2,3,另外的一次返回2,1,3). Limit限制的是从结果集的M位置处取出N条输出,其余抛弃.

方法2: 建立主键或唯一索引, 利用索引(假设每页10条)

方法3: 基于索引再排序

语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 WHERE id_pk > (pageNum*10) ORDER BY id_pk ASC LIMIT M
适应场景: 适用于数据量多的情况(元组数上万). 最好ORDER BY后的列对象是主键或唯一所以,使得ORDERBY操作能利用索引被消除但结果集是稳定的(稳定的含义,参见方法1)
原因: 索引扫描,速度会很快. 但MySQL的排序操作,只有ASC没有DESC(DESC是假的,未来会做真正的DESC,期待...).

方法4: 基于索引使用prepare

第一个问号表示pageNum，第二个？表示每页元组数

语句样式: MySQL中,可用如下方法: PREPARE stmt_name FROM SELECT * FROM 表名称 WHERE id_pk > (？* ？) ORDER BY id_pk ASC LIMIT M
适应场景: 大数据量
原因: 索引扫描,速度会很快. prepare语句又比一般的查询语句快一点。

方法5: 利用MySQL支持ORDER操作可以利用索引快速定位部分元组,避免全表扫描

比如: 读第1000到1019行元组(pk是主键/唯一键).

SELECT * FROM your_table WHERE pk>=1000 ORDER BY pk ASC LIMIT 0,20

方法6: 利用"子查询/连接+索引"快速定位元组的位置,然后再读取元组.

比如(id是主键/唯一键,

关注