03 mysql数据查询_03-02-高级操作(查询数据)

# 查询数据

完整的查询指令

`select select选项 字段列表 from 表名 where 条件 group by 分组 having条件 order by 排序 limit 限制;`

- select 选项

系统该如何对待查询得到的结果

`all`:默认的,表示保存所有的记录

`distinct`:去重,去除重复(所有字段都相同)的记录,只保留一条

- 字段列表

有的时候需要从多张表中获取数据,在获取数据的时候,可能存在不同表中有同名的字段,需要将同名字段命名为不同名的:别名`alias`

基本语法:`字段名 [as] 别名`

![](https://box.kancloud.cn/6a5f97fad542b78bf5b4b2edd393d3b2_2556x506.jpg)

## `from`数据源

`from`是为前面的查询提供数据:数据源只要是一个符合二维表结构的数据即可。

### 单表数据

>基本语法:`from 表名`

### 多表数据

从多张表获取数据

> 基本语法:`from 表1,表2...`

![](https://box.kancloud.cn/0a046cb6fd70d5300d81b2948daade75_1260x1176.jpg)

结果:两张表的记录相乘,字段拼接

本质操作:从第一张表取出一条记录,去拼凑第二张表的所有记录,并保留所有结果。得到的结果在数学上称为:笛卡尔积,这个结果除了给数据库造成压力,没有其他意义,所以在实际使用中应该尽量避免出现笛卡尔积。

### 动态数据

`from`后面跟的不是实体表,而是一个从表中查询出来得到的二维结果表。

>基本语法:`from (select 字段列表 from 表名) [as] 别名;`

>

![](https://box.kancloud.cn/304bead602889c2e1b894172c35abcd6_2498x494.jpg)

## `where`子句

`where`用来从数据表获取数据的时候,进行条件筛选。

数据获取原理:针对表去对应的磁盘处获取所有的记录(一条条),`where`的作用就是在拿到一条结果就开始进行判断,判断是否符合条件:如果符合条件就保留下来

`where`本身不能判断,而是通过运算符进行结果比较来判断数据。

## `group by`子句

`group by`表示分组的含义,根据指定的字段,将数据进行分组:分组的目标是为了统计。

### 分组统计

> 基本语法:`group by 字段名`

>

```

alter table my_student add class_id int;

update my_student set class_id=1 where stu_id in ('stu0001','stu0002');

update my_student set class_id=2 where stu_id in('stu0003','stu0004');

//在MySQL 5.7.5后only_full_group_by成为sql_mode的默认选项之一,这可能导致一些sql语句失效

select * from my_student group by class_id;

```

[MySQL 5.7.5后only_full_group_by成为sql_mode的默认选项之一,这可能导致一些sql语句失效](https://www.cnblogs.com/fswhq/p/9729761.html)

`group by`是为了分组后进行数据统计的,如果只是想看数据显示,那么`group by`没有任何意义:`group by`将数据按照指定的字段分组之后,只会保留每组的第一条记录(5.7.5支版本之前可以这么操作)

一些统计函数(聚合函数):

- `count()`:统计每组中的数量,如果统计目标是字段,那么统计不为空的字段,如果为`*`代表统计记录

- `avg()`:求平均值

- `sum()`:求和

- `max()`:求最大值

- `min()`:求最小值

#### 测试案例

**数据准备**

```

alter table my_student add stu_age tinyint unsigned;

alter table my_student add stu_height tinyint unsigned;

update my_student set stu_age=18,stu_height=185 where stu_id='stu0001';

update my_student set stu_age=28,stu_height=165 where stu_id='stu0002';

update my_student set stu_age=22,stu_height=187 where stu_id='stu0003';

update my_student set stu_age=25,stu_height=189 where stu_id='stu0004';

```

**测试场景**

按照班级,统计每班人数、最大年龄、最低身高、评论年龄

```

select count(*),max(stu_age),min(stu_height),avg(stu_age) from my_student group by stu_id;

```

![](https://box.kancloud.cn/488e0c4076e1eb4c50c80e3cbfa0d1fa_2554x398.jpg)

`group_concat()`:是为了将分组中指定的字段进行合并(字符串拼接)

```

select group_concat(stu_name), count(*),max(stu_age),min(stu_height),avg(stu_age) from my_student group by class_id;

```

![](https://box.kancloud.cn/ba8ed380f527c6a9569d279779334cb9_2552x440.jpg)

### 多分组

将数据按照某个字段进行分组之后,对已经分组的数据进行再次分组

基本语法:`group by 字段1,字段2`//先按照字段1进行分组,然后在按照字段2进行分组

### 分组排序

`MySQL`中,分组默认又排序的功能:按照分组字段进行排序,默认是生序

> 基本语法:`group by 字段1 [asc|desc],字段2 [asc|desc]`

>

### 回溯统计

当进行多分组之后,往上统计的过程中,需要进行层层上报,将这种层层上报统计的过程称之为回溯统计:每一次分组向上统计的过程都会产生一次新的统计数据,而且当前数据对应的分组字段为`NULL`

基本语法:`group by 字段 [asc|desc] with rollup`

## `having` 子句

`having`本质和`where`是一样的,是用来进行数据条件筛选,但是也有和`where`的不同点

1. `having`是在`group by`子句之后:可以针对分组数据进行筛选统计,但是`where`不行

查询班级人数大于等于4个以上的班级

```

insert into my_student values('stu0007','小江',1,17,172,2);

select class_id , count(*) as number from my_student group by class_id having number >=4;

```

![](https://box.kancloud.cn/31cc5f2d1357dbba1ad66cdeed5c54c4_2558x1386.jpg)

`having`在`group by`分组之后,可以使用聚合函数或者别名

**强调**

`having`是用在`group by`之后,`group by`是用在`where`之后:`where`的时候表示数据从磁盘拿到内存,`where`之后的所有操作都是内存操作。

## `order by`子句

`order by`排序:根据校对规则对数据进行排序

> 基本语法:`order by 字段 [asc|desc];` //默认是`asc`可以不用写

```

//按照身高排序

select * from my_student order by stu_height;

```

![](https://box.kancloud.cn/009a77af95df34510be8d1a664c4131a_2558x656.jpg)

`order by`也可以像`group by`一样进行多字段排序:规则就是先按照第一个字段排序,然后在按照后面的字段排序

> 基本语法:`order by 字段1 [asc|desc] , 字段2 [asc|desc]`

>

```

// 按照班级以及身高排序

select * from my_student order by class_id desc ,stu_height asc;

```

![](https://box.kancloud.cn/4062c197adfe308642c5b3d377c765cd_2554x622.jpg)

## `limit`子句

`limit`限制子句:主要是用来限制记录数量获取

### 记录数限制

纯粹的限制获取的数量:从第一条到指定的数量

> 基本语法:`limit 数量`

>

`limit`通常在查询的时候如果限定为一条记录的时候,使用的比较多:有时候获取多条记录并不能解决业务问题,但是会增加服务器压力。

### 分页

利用`limit`来限制获取指定区间的数据。

> 基本语法:`limit offset , length` //offset 偏移量 length 具体获取几条数据

>

> `MySQL`中的记录从0开始

>

> `limit 0,2`获取前两条数据

>

数据治理是确保数据准确性、可靠性、安全性、可用性和完整性的体系和框架。它定义了组织内部如何使用、存储、保护和共享数据的规则和流程。数据治理的重要性随着数字化转型的加速而日益凸显,它能够提高决策效率、增强业务竞争力、降低风险,并促进业务创新。有效的数据治理体系可以确保数据在采集、存储、处理、共享和保护等环节的合规性和有效性。 数据质量管理是数据治理中的关键环节,它涉及数据质量评估、数据清洗、标准化和监控。高质量的数据能够提升业务决策的准确性,优化业务流程,并挖掘潜在的商业价值。随着大数据和人工智能技术的发展,数据质量管理在确保数据准确性和可靠性方面的作用愈发重要。企业需要建立完善的数据质量管理和校验机制,并通过数据清洗和标准化提高数据质量。 数据安全与隐私保护是数据治理中的另一个重要领域。随着数据量的快速增长和互联网技术的迅速发展,数据安全与隐私保护面临前所未有的挑战。企业需要加强数据安全与隐私保护的法律法规和技术手段,采用数据加密、脱敏和备份恢复等技术手段,以及加强培训和教育,提高安全意识和技能水平。 数据流程管理与监控是确保数据质量、提高数据利用率、保护数据安全的重要环节。有效的数据流程管理可以确保数据流程的合规性和高效性,而实时监控则有助于及时发现并解决潜在问题。企业需要设计合理的数据流程架构,制定详细的数据管理流程规范,并运用数据审计和可视化技术手段进行监控。 数据资产管理是将数据视为组织的重要资产,通过有效的管理和利用,为组织带来经济价值。数据资产管理涵盖数据的整个生命周期,包括数据的创建、存储、处理、共享、使用和保护。它面临的挑战包括数据量的快速增长、数据类型的多样化和数据更新的迅速性。组织需要建立完善的数据管理体系,提高数据处理和分析能力,以应对这些挑战。同时,数据资产的分类与评估、共享与使用规范也是数据资产管理的重要组成部分,需要制定合理的标准和规范,确保数据共享的安全性和隐私保护,以及建立合理的利益分配和权益保障机制。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值