项目中可能有这样的需求,从一张表中随机取出几条数据,下面给出几种方案,几种方案之间的区别就是sql执行的效率问题
首先创建一张表
CREATE TABLE `que_bank` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键id',
`gmt_create` datetime NOT NULL COMMENT '创建时间',
`gmt_modified` datetime NOT NULL COMMENT '修改时间',
`title` varchar(256) NOT NULL COMMENT '试题标题',
`content` varchar(1024) NOT NULL COMMENT '试题内容',
`answer` varchar(128) NOT NULL COMMENT '试题答案',
`user_id` bigint(20) DEFAULT NULL COMMENT '创建者id',
`degree` tinyint(2) NOT NULL COMMENT '试题难度系数',
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='题库表';
1. 方案一
SELECT * FROM que_bank ORDER BY RAND() LIMIT 1;
这种是最常见的方案,但是mysql 手册里面针对RAND()函数的解释是,在 ORDER BY从句里面不能使用RAND()函数,因为这样会导致数据列被多次扫描,效率非常低,所以这种方案是很低级的方案,最好不要使用
2. 方案二
SELECT
*
FROM
`que_bank`
WHERE id >=
(SELECT
FLOOR(
RAND() * (
(SELECT
MAX(id)
FROM
`que_bank`) -
(SELECT
MIN(id)
FROM
`que_bank`)
) +
(SELECT
MIN(id)
FROM
`que_bank`)
))
ORDER BY id
LIMIT 1 ;
这种方案效率比第一种提高了很多,这种查询的方式是在where条件中使用函数,但是查询的效率还不是最高,还有提升的空间。
3. 方案三
SELECT
q1.id,
q1.gmt_create,
q1.gmt_modified,
q1.title,
q1.content,
q1.user_id,
q1.answer,
q1.degree
FROM que_bank AS q1 JOIN
(SELECT ROUND(RAND() * ((SELECT MAX(id) FROM que_bank)-
(SELECT MIN(id) FROM que_bank))+(SELECT MIN(id) FROM que_bank)) AS id) AS q2
WHERE q1.id >= q2.id
ORDER BY q1.id LIMIT 1;
这种方式是使用了join的sql语法,这种方案查询的效率最高,查询出来的结果是随机性的,不是按照某种特定的顺序,所以达到我们的目的,方案三可行。
最后总结一下三种方案的可行性:
方案一:方案一 在数据量很大的情况下,万条以上就不能使用这种方式了,所以方案一基本上处于不可行的情况。
方案二:方案二的效率还可以,但是还有提升的空间,数据量小的情况下是可行的。
方案三:方案三的效率是三种方式中最高的,建议使用。
当然了,这三种方式可能只是解决随机取数据中的几种方式而已,如果读者有更好的方式,不吝赐教,谢谢!