很久以前,从网上看到一遍在mysql抽取随机记录的文章《mysql中RAND()随便查询记录效率问题和解决办法》。
今天,我打算分析一下这个最优语句:
SELECT * FROM `table` AS t1
JOIN (
SELECT ROUND(
RAND()
*
(
(SELECT MAX(id) FROM `table`) - (SELECT MIN(id) FROM `table`)
) + (
SELECT MIN(id) FROM `table`
)
) AS id
) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id LIMIT 1;
经过我换行、顶格之后。原理分析就简单多了,基本上是数学知识。
大概意思是:给表t1一个符合它范围的随机数id,然后取比这大或等于的数。
语句解析1:表的最大值减去最小值,得到的就是范围长度值
(SELECT MAX(id) FROM `table`) - (SELECT MIN(id) FROM `table`)
语句解析2:也就是从该表的最小值位置开始算起咯,这就相当于现有数据的ID的范围了
范围长度值 + SELECT MIN(id) FROM `table`
又由于mysql的随机数rand产生的随机数值作用域为 0≤x<1
最后这里的值就是数据表中的记录ID的区间了,乘以这个相当于百分比的随机数,得出了的结果有可能不是某一个ID的值。
SELECT ROUND(
RAND()
*
(
(SELECT MAX(id) FROM `table`) - (SELECT MIN(id) FROM `table`)
) + (
SELECT MIN(id) FROM `table`
)
) AS id
上面得出的随机数还得join一次,这是为了给这个不确定是不是ID的随机数找一个确定值,于是使用JOIN加上了条件。
最终,你将获取到一条记录。
如果你想用上面的语句获取多条随机记录,我想不可能,如果你认真看分析,你就知道每次产生的符合范围的随机数,只有一个。
若你想获取多条随机记录,由于效率较于其他语句不错,不防执行多几次上面的语句,得到你想要的结果。