《数据库系统概论》3——关系数据库标准语言SQL

最新推荐文章于 2024-04-26 19:52:36 发布

箬渊凡

最新推荐文章于 2024-04-26 19:52:36 发布

阅读量1k

点赞数 2

分类专栏：数据库学习笔记文章标签：数据库 sql mysql

本文链接：https://blog.csdn.net/m0_65036580/article/details/129231357

版权

数据库学习笔记专栏收录该内容

10 篇文章 0 订阅

订阅专栏

SQL概述

结构化查询语言，是关系数据库的标准语言，是一个通用的，功能极强的关系数据库语言

SQL的产生与发展

目前没有一个数据库系统能够支持SQL标准的所有概念和特性

SQL的特点

综合统一

集数据定义语言（DDL），数据操纵语言（DML），数据控制语言（DCL）功能于一体

可以独立完成数据库生命周期中的全部活动

定义和修改、删除关系模式，定义和删除视图，插入数据，建立数据库
对数据库中的数据进行查询和更新
数据库重构与维护
数据库安全性、完整性控制以及事务控制
嵌入式SQL和动态SQL定义

用户数据库投入运行后，可根据需要随时逐步修改模式，不影响数据库的运行

数据操作符统一

高度非过程化

非关系数据模型的数据操纵语言“面向过程”，必须指定存取路径

SQL面向问题，无需了解存取路径

存取路径的选择以及SQL的操作过程由系统自动完成

面向集合的操作方式

非关系数据模型采用面向记录的操作方式，操作对象是一条记录

SQL采用集合操作方式

操作对象，查找结果可以是元组的集合
一次插入，删除，更新操作的对象可以是元组的集合

以同一种语法结构提供多种使用方式

SQL是独立的语言——能够独立地用于联机交互的使用方式

SQL又是嵌入式语言——SQL能够嵌入到高级语言（例如C，C++，Java）程序中，供程序员设计程序时使用

语言简洁，易学易用

SQL功能极强，完成核心功能只用了9个动词

SQL的动词
SQL功能	动词
数据查询	select
数据定义	create（建立）drop（删除）alter（修改）
数据操纵	insert（插入）update（修改）delete（删除）
数据控制	grant（授予权限）revoke（收回权限）

SQL的基本概念

支持关系数据库三级模式结构
外模式——视图&&部分基本表
模式——基本表
内模式——存储文件

基本表

本身独立存在的表
SQL中一个关系就对应一个基本表
一个（或多个）基本表对应一个存储文件
一个表可以带若干索引

存储文件

逻辑结构组成了关系数据库的内模式
物理结构对用户是隐蔽的

视图

从一个或几个基本表导出的表
数据库中只存放视图的定义而不存放视图对应的数据
视图是一个虚表
用户可以在视图上再定义视图

学生-课程数据库

学生表

课程表

成绩表

数据定义

SQL的数据定义功能

模式定义
表定义
视图和索引的定义

模式

数据库（有的系统称为目录）-->模式-->表以及视图、索引等

现代关系数据库管理系统提供了一个层次化的数据库对象命名机制

一个关系数据库管理系统的实例中可以建立多个数据库
一个数据库中可以建立多个模式
一个模式下通常包括多个表，视图和索引等数据库对象

模式的定义与删除

定义模式

定义模式实际上定义了一个命名空间

在这个空间中可以定义该模式包含的数据库对象，例如基本表，视图，索引等

在CREATE SCHEMA中可以接受CREATE TABLE,CREATE VIEW和GRANT子句

CREATE SCHEMA <模式名> AUTHORIZATION <用户名>[<表定义子句>|<视图定义子句>|<授权定义子句>]

删除模式

DROP SCHEMA<模式名><CASCADE|RESTRICT>

CASCADE（级联）——删除模式的同时把该模式中所有的数据库对象全部删除

RESTRICT（限制）——如果该模式中定义了下属的数据库对象（如表，视图等），则拒绝该删除语句的执行，仅当该模式中没有任何下属的对象时才能执行

基本表的定义、删除与修改

定义基本表

如果完整性约束条件涉及到该表的多个属性列，则必须定义在表级上，否则既可以定义在列级也可以定义在表级

数据类型

SQL中域的概念用数据类型来实现

定义表的属性时需要指明其数据类型及长度

选用那种数据类型

取值范围
要做那些运算

在 MySQL 中，有三种主要的类型：Text（文本）、Number（数字）和 Date/Time（日期/时间）类型

模式与表

每个基本表都属于某一个模式

一个模式包含多个基本表

定义基本表所属模式

在表名中明显的给出模式名
在创建模式语句中同时创建表
设置所属的模式

创建基本表时，如果没有指定模式，系统根据搜索路径来确定该对象所属的模式

关系数据库管理系统会使用模式列表中第一个存在的模式作为数据库对象的模式名

若搜索路径中的模式名都不存在，系统将给出错误

显示当前搜索路径：

SHOW search_path

搜索路径的当前默认值;

$user,PUBLIC

数据库管理员用户可以设置搜索路径，然后定义基本表

SET search_path TO "S-T",PUBLIC;

Create table Student(...);

结果建立了S-T.Student基本表

关系数据库挂了你系统发现搜索路径中第一个模式名S-T，就把该模式作为基本表Student所属的模式

修改基本表

ADD子句用于增加新列，新的列级完整性约束条件和新的表级完整性约束条件

在新增数据列的时候，无论基本表中原来是否有数据，新增列一律为空值

因为我用的是MySQL，所以修改原表列的数据类型用modify子句

DROP COLUMN子句用于删除指定的完整性约束条件

DROP CONSTRAINT子句用于删除指定的完整性约束条件

索引的建立与删除 -- 内模式

建立索引的目的：加快查询速度

关系数据库管理系统总常见的索引：

顺序文件上的索引
B+树索引
散列索引
位图索引

特点：

B+树索引具有动态平衡的优点
HASH索引具有查找速度快的特点

数据库管理员或表的属主（建立表的人）可以建立索引

关系数据库管理系统自动维护索引

关系数据库管理系统自动选择合适的索引作为存取路径，用户不必也不能显示地选择索引

建立索引

显示索引

删除索引

索引可以建立在表的一列或者多列上，各列名之间用逗号分隔

可以用CLUSTER表示建立的索引是聚簇索引，但是如果表经常更新则不建议这种索引

数据字典

数据字典是关系数据库管理系统内部的一组系统表，它记录了数据库中所有定义信息;

关系模式定义
视图定义
索引定义
完整性约束定义
各类用户对数据库的操作权限
统计信息等

关系数据库管理系统在执行SQL的数据定义语句时，实际上就是在更新数据字典表中的相应信息

数据查询

SELECT子句：指定要显示的属性列

FROM子句：指定查询对象（基本表或视图）

WHERE子句：指定查询条件

GROUP BY子句：对查询结果按指定列的值分组，该属性列值相等的元组为一个组。通常会在每组中作用聚集函数

HAVING短语：只有满足指定条件的组才予以输出

ORDER BY子句：对查询结果表按指定列值升序或降序排列

单表查询

查询仅涉及一个表

选择表中的若干列

查询指定列

查询全部列

全部列和指定列之间的区别就是一个只有部分列，一个是全部的列，全部的列可以全部列出来，也可以直接用*代替

查询经过计算的值

使用列别名改变查询结果的列标题

选择表中的若干元组

消除取值重复的行

指定DISTINCT关键词，去掉表中重复的行

查询满足条件的元组

比较大小

确定范围

确定集合

字符匹配

能写=就不要写like，因为like有限制条件

涉及空值的查询

多重条件查询

ORDER BY子句

聚集函数

统计元组个数——COUNT(*)
统计一列中值的个数————COUNT([DISTINCT|ALL]<列名>)
计算一列值的总和（此列必须为数值型）——SUM([DISTINCT|ALL]<列名>)
计算一列值的平均值（此列必须为数值型）——AVG([DISTINCT|ALL]<列名>)
求一列中的最大值和最小值——MAX | MIN([DISTINCT|ALL]<列名>)

GROUP BY子句

细化聚集函数的作用对象

如果未对查询结果分组，聚集函数将作用于整个查询结果
对查询结果分组后，聚集函数将分别作用于每个组
按指定的一列或多列值分组，值相等的为一组
默认升序

HAVING短语和WHERE子句的区别：

作用对象不同
- WHERE子句作用于基表或视图，从中选择满足条件的元组
- HAVING 短语作用于组，从中选择满足条件的组

连接查询

SQL本身无连接操作

连接查询：同时涉及两个以上的表的查询

连接条件或连接谓词：用来连接两个表的条件

连接字段：连接谓词中的列名称

连接条件中的各连接字段类型必须是可比的，但名字不必相同

等值与非等值连接查询

等值连接：连接运算符为=

连接操作的执行过程：

嵌套循环法

首先在表1中找到第一个元组，然后从头开始扫描表2，逐一查找满足连接件的元组，找到后就将表1中的第一个元组与该元组拼接起来，形成结果表中一个元组
表2全部查找完后，再找表1中第二个元组，然后再从头开始扫描表2，逐一查找满足连接条件的元组，找到后就将表1中的第二个元组与该元组拼接起来，形成结果表中一个元组
重复上述操作，直到表1中的全部元组都处理完毕

排序合并法

常用于=连接
首先按连接属性对表1和表2排序
对表1的第一个元组，从头开始扫描表2，顺序查找满足连接条件的元组，找到后就将表1中的第一个元组与该元组拼接起来，形成结果表中一个元组。当遇到表2中第一条大于表1连接字段值的元组时，对表2的查询不在继续
找到表1的第二条元组，然后从刚才的中断点处继续顺序扫描表2，查找满足连接条件的元组，找到后就将表1中的第一个元祖与该元组拼接起来，形成结果表中一个元组。直接遇到表2中大于表1连接字段值的元组时，对表2的查询不在继续。
重复上述操作，直到表1或表2中的全部元组都处理完毕为止

索引连接

对表2按连接字段建立索引
对表1中的每个元组，依次根据其连接字段值查询表2的索引，从中找到满足条件的元组，找到后就将表1中的第一个元组与该元组拼接起来，形成结果表中一个元组

自然连接

一条SQL语句可以同时完成选择和连接查询，这时WHERE子句是由连接谓词和选择谓词组成的复合条件

执行过程：

先从sc中挑选出Cno = '2'并且Grade > 90的元组形成一个中间关系
再和student中满足连接条件的元组进行连接得到最终的结果关系

自身连接

自身连接：一个表与其自己进行连接

需要给表起别名以示区别

由于所有属性名都是同属性名，因此必须使用别名前缀

外连接

外连接与普通连接的区别

普通连接操作只输出满足连接条件的元组
外连接操作以指定表为连接主体，将主体表中不满足连接条件的元组一并输出
左外连接
- 列出左边关系中所有的元组
右外连接
- 列出右边关系中所有的元组

多表连接

两个以上的表进行连接

嵌套查询

嵌套查询概述：

一个SELECT-FROM-WHERE语句称为一个查询块

将一个查询块嵌套在另一个查询块的WHERE子句或HAVING短语的条件中的查询称为嵌套查询

有些嵌套可以用连接表示

SQL语言允许多层嵌套查询——即一个子查询中还可以嵌套其他子查询

子查询的限制——不能使用ORDER BY子句

不相关子查询：

子查询的查询条件不依赖与父查询

有里向外，逐层处理，即每个子查询在上一级查询处理之前求解，子查询的结果用于建立其父查询的查找条件

带有IN谓词的子查询

无关查询最好使用连接

将查询分为N步，将第N-1步利用IN放入第N步的WHERE子句中，将N-2放入N-1中……

带有比较运算符的子查询

当能确切知道内层查询返回单值时，可用比较运算符（>,<,=,>=,<=,!=或<>）

用=替代IN

因为有比较，所以是相关子查询，父查询需要满足条件

带有ANY(SOME)或ALL谓词的子查询

使用ANY或ALL谓词时，必须同时使用比较运算符

>ANY	大于子查询结果中的某个值
>ALL	大于子查询中的所有值
<ANY	小于。。。
<ALL	小于。。。
>=ANY	大于等于。。。
>=ALL	大于等于。。。
<=ANY	小于等于。。。
<=ALL	小于等于。。。
=ANY	等于。。。
=ALL	等于。。。
!=(或<>)ANY	不等于。。。
!=(或<>)ALL	不等于。。。

带有EXISTS谓词的子查询

EXISTS谓词

存在量词 $\exists$

带有EXISTS谓词的子查询不返回任何数据，只产生逻辑真值true和逻辑假值false

若内层查询结果非空，则外层的WHERE子句返回真值
若内层查询结果为空，则外层的WHERE子句返回假值

由EXISTS引出的子查询，其目标列表表达式通常用*，因为带个EXISTS的子查询只返回真值或假值，给出列名无实际意义

不同形式的查询间的替换

一些带EXISTS或NOT EXISTS谓词的子查询不能被其他形式的子查询等价替换
所有带IN谓词，比较运算符，ANY和ALL谓词的子查询都能用带EXISTS谓词的子查询等价替换

用EXISTS/NOT EXISTS实现全称量词

SQL语言中没有全称量词 $\forall$
可以把带有全称量词的谓词转换成等价的带有存在量词的谓词( $(\forall x)P \equiv$ ¬( $\exists x$ (¬P))

用EXISTS/NOT EXISTS实现逻辑蕴涵

SQL语言中没有蕴含逻辑运算
可以利用谓词演算将逻辑蕴含谓词等价转换为：p→q≡¬p∨q

集合查询

GROUP BY不可以存在SELECT中，因为会找不到

GROUP BY中的列不一定要出现在SELECT中

语义是人的解释，所以人能听懂能区分但是机器不能

HAVING是对分组的约束

HAVING是限制在分组的属性上的时候可以被WHERE代替

WHERE先执行，HAVING后执行，前面限制越多，程序效率越高，因此能用WHERE代替HAVING的时候尽量用WHERE

嵌套子查询中可以使用DISTINCT

嵌套子查询只有在不相关的查询中才会有相应的连接

集合操作的种类

并UNION
交INTERSECT
差EXCEPT

参加集合操作的各查询结果的列数必须相同；对应项的数据类型也必须相同

UNION将多个查询结果合并起来，系统自动去掉重复元组

UNION ALL将多个查询结果合并起来时，保留重复元组

因为MySQL不支持交集和差的运算，所以这里就不截图展示了，给大家看一下代码

交集：

SELECT Sno

FROM SC

WHERE Cno = '1'

INTERSECT

SELECT Sno

FROM SC

WHERE Cno = '2';

差集：

SELECT *

FROM Student

WHERE Sdept = 'CS'

EXCEPT

SELECT *

FROM Student

WHERE Sage <= 19;