MySQL排序临时表应用,mysql 随机选数据---MySQL对临时表排序的执行过程

最新推荐文章于 2023-02-06 20:45:30 发布

嘎嘎的靼

最新推荐文章于 2023-02-06 20:45:30 发布

阅读量183

点赞数

文章标签： MySQL排序临时表应用

mysql 随机选数据---MySQL对临时表排序的执行过程

mysql 随机选数据

表结构

查询语句

临时内存表的排序

这条语句的执行流程是这样的

磁盘临时表

MySQL 5.6版本引入的一个新的排序算法--优先队列排序算法

优化随机排序

mysql 随机选数据

表结构

CREATE TABLE `words` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`word` varchar(64) DEFAULT NULL,

PRIMARY KEY (`id`)

) ENGINE=InnoDB;

查询语句

select word from words order by rand() limit 3;

先总结：order by rand()使用了内存临时表，内存临时表排序的时候使用了rowid排序方法。

临时内存表的排序

对于InnoDB表来说，执行全字段排序会减少磁盘访问，因此会被优先选择。

对于内存表，回表过程只是简单地根据数据行的位置，直接访问内存得到数据，根本不会导致多访问磁盘。优化器没有了这一层顾虑，那么它会优先考虑的，就是用于排序的行越少越好了，所以，MySQL这时就会选择rowid排序。

这条语句的执行流程是这样的

创建一个临时表。这个临时表使用的是memory引擎，表里有两个字段，第一个字段是double类型，为了后面描述方便，记为字段R，第二个字段是varchar(64)类型，记为字段W。并且，这个表没有建索引。

从words表中，按主键顺序取出所有的word值。对于每一个word值，调用rand()函数生成一个大于0小于1的随机小数，并把这个随机小数和word分别存入临时表的R和W字段中，到此，扫描行数是10000。

现在临时表有10000行数据了，接下来你要在这个没有索引的内存临时表上，按照字段R排序。

初始化 sort_buffer。sort_buffer中有两个字段，一个是double类型，另一个是整型。

从内存临时表中一行一行地取出R值和位置信息(rowid)，分别存入sort_buffer中的两个字段里。这个过程要对内存临时表做全表扫描，此时扫描行数增加10000，变成了20000。

在sort_buffer中根据R的值进行排序。注意，这个过程没有涉及到表操作，所以不会增加扫描行数。

排序完成后，取出前三个结果的位置信息，依次到内存临时表中取出word值，返回给客户端。这个过程中，访问了表的三行数据，总扫描行数变成了20003。

MySQL的表是用什么方法来定位“一行数据”的。

有主键则用主键。

如果你创建的表没有主键，或者把一个表的主键删掉了，那么InnoDB会自己生成一个长度为6字节的rowid来作为主键。

这也就是排序模式里面，rowid名字的来历。实际上它表示的是：每个引擎用来唯一标识数据行的信息。

对于有主键的InnoDB表来说，这个rowid就是主键ID；

对于没有主键的InnoDB表来说，这个rowid就是由系统生成的；

MEMORY引擎不是索引组织表。在这个例子里面，你可以认为它就是一个数组。因此，这个rowid其实就是数组的下标。

磁盘临时表

tmp_table_size这个配置限制了内存临时表的大小，默认值是16M。如果临时表大小超过了tmp_table_size，那么内存临时表就会转成磁盘临时表。

sort_buffer_size

max_length_for_sort_data 是MySQL中专门控制用于排序的行数据的长度的一个参数。它的意思是，如果单行的长度超过这个值，MySQL就认为单行太大，要换一个算法。,排序字段小于这个将按照rowid排序。

磁盘临时表使用的引擎默认是InnoDB，是由参数internal_tmp_disk_storage_engine控制的。

当使用磁盘临时表的时候，对应的就是一个没有显式索引的InnoDB表的排序过程。

使用归并排序算法

MySQL 5.6版本引入的一个新的排序算法--优先队列排序算法

执行流程如下：

对于这10000个准备排序的(R,rowid)，先取前三行，构造成一个堆；

(对数据结构印象模糊的同学，可以先设想成这是一个由三个元素组成的数组)

取下一个行(R’,rowid’)，跟当前堆里面最大的R比较，如果R’小于R，把这个(R,rowid)从堆中去掉，换成(R’,rowid’)；

重复第2步，直到第10000个(R’,rowid’)完成比较。

优化随机排序

取得整个表的行数，记为C；

根据相同的随机方法得到Y1、Y2、Y3；

再执行三个limit Y, 1语句得到三行数据。

select count(*) into @C from t;

set @Y1 = floor(@C * rand());

set @Y2 = floor(@C * rand());

set @Y3 = floor(@C * rand());

select * from t limit @Y1，1； //在应用代码里面取Y1、Y2、Y3值，拼出SQL后执行

select * from t limit @Y2，1；

select * from t limit @Y3，1；

mysql 随机选数据---MySQL对临时表排序的执行过程相关教程

【机器学习】应用简例随机森林交叉验证网格化搜索

【机器学习】应用简例随机森林交叉验证网格化搜索 %matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import train_test_split

Mysql 架构和工作流程

Mysql 架构和工作流程一 Mysql 架构分层总体上，我们把Mysql分为三层：建立连接和交互的客户端真正执行操作的服务层跟硬件打交道的存储引擎层二 Mysql 查询过程 (1) 查询过程看图了解Mysql查询大致过程：客户端向服务端发起一条请求(这里建立通信

快充芯片IP5328P的寄存器数据读写[用于DIY数显快充充电宝]

快充芯片IP5328P的寄存器数据读写[用于DIY数显快充充电宝] 【本帖DIY因为有一定的危险性，非专业人员请勿自行尝试】【如有侵权联系删除】 IP5328P是一款最大18W的快充芯片，主要用于快充充电宝的产品，基本支持市面上绝大部分主流的快充协议。因为能看到本

Web - JS当中的数组、循环、随机数和定时器的使用训练(随机点名

Web - JS当中的数组、循环、随机数和定时器的使用训练(随机点名器) 随机点名器训练，配套的还有网页轮播图训练。做出来的效果: 代码如下 !DOCTYPE htmlhtml lang=enhead meta charset=UTF-8 meta name=viewport content=width=device-width, initial-scale=1

python3往excel表中写数据(可以设置文件目录，文件名称，sheet

python3往excel表中写数据(可以设置文件目录，文件名称，sheet表头，写入的内容) 1、前述介绍我在测试一个智能对话项目时需要评估对话的准确率，就设计了一些问题放到excel表中，读取问题并触发问答后把响应信息按需要的数据写入到另外一个excel中。基于这

MySQL 第一次安装与使用

MySQL 第一次安装与使用笔者所用的操作系统是win10 MySQL下载 https://downloads.mysql.com/archives/community/ 安装解压下载的文件到指定的目录将解压后的Mysql路径配置到环境变量中, 例如： D:\Software\mysql\bin 启动添加配置文件 my.ini 到MySql安

Jmeter之连接MySQL数据库操作

Jmeter之连接MySQL数据库操作 Jmeter之连接MySQL数据库看完本文后，你将学会如何使用Jmeter连接MySQL数据库，并且进行操作。在学习如何使用Jmeter连接MySQL之前，我们要先安装Jmeter，Jmeter的安装可以见本博主的另一篇博客：Jmeter学习之环境搭建进行安装

python3读取excel表数据(可指定sheet表读取及设置读取后返回的

python3读取excel表数据(可指定sheet表读取及设置读取后返回的数据类型) 1、前述介绍我在测试一个智能对话项目时需要评估对话的准确率，就设计了一些问题放到excel表中，读取问题并触发问答后把响应信息按需要的数据写入到另外一个excel中。基于这个，我分