问题引出:在我们开发的过程中可能会经常的遇到一个问题就是如何随机的显示众多数据中的几条?比如在笔者之前做的一个英文单词记忆练习中便出现了这样的问题,如果让你来写这样的一条语句你会怎么写呢?
首先我们先建立一张表,表名为words,并且随机插入一些字母组合:
mysql> CREATE TABLE `words` ( `id` int(11) NOT NULL AUTO_INCREMENT, `word` varchar(64) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB; delimiter ;; create procedure idata() begin declare i int; set i=0; while i<10000 do insert into words(word) values(concat(char(97+(i div 1000)), char(97+(i % 1000 div 100)), char(97+(i % 100 div 10)), char(97+(i % 10)))); set i=i+1; end while; end;; delimiter ; call idata();
其次就是写SQL语句了,大家应该基本都会想到一个基本写法:
select * from words order by rand() limit 3;
这样的语句大家一般都可以想到的,但是这样的执行流程是比较复杂的。我们接下来就来分析一下这条语句的执行流程。
分析语句
explain select * from words order by rand() limit 3;
在Extra中可以看到Using temporary 是表示使用的临时表, Using filesort表示进行了排序。
而在上一篇文章中写有提到对于临时内存表的排序来说,执行全字段排序会减少磁盘的访问,所以会被优先选择。
但是对于内存表来说,回表过程只是简单的根据数据行的位置,直接访问内存得到数据,不会导致多次访问磁盘。优化器没有了这层顾虑,那么他就会优先考虑内存中少一些数据,这样更有利于排序,所以便会选择rowid的排序方式。
理解了算法的选择的逻辑,来看看今天的那句sql的执行流程。
-
创建一个临时表。这个临时表使用的是memory引擎,表里有两个字段,第一个字段是double类型,为了后面描述方便,记为字段R,第二个字段是varchar(64)类型,记为字段W。并且,这个表没有建索引。
-
从words表中,按主键顺序取出所有的word值。对于每一个word值,调用rand()函数生成一个大于0小于1的随机小数,并把这个随机小数和word分别存入临时表的R和W字段中,到此,扫描行数是10000。
-
现在临时表有10000行数据了&#