ch11 SQL概述
- SQL(Structured Query Language)结构化查询语言,是关系数据库的标准语言
- SQL是一个通用的、功能极强的关系数据库语言
- 综合统一
- 高度非过程化
- 面向集合的操作方式
- 以同一种语法结构提供两种使用方法
- 语言简洁,易学易用
SQL的特点
- 综合统一
- 集数据定义语言(DDL),数据操纵语言(DML),数据控制语言(DCL)功能于一体
- 可以独立完成数据库生命周期中的全部活动
- 用户数据库投入运行后,可根据需要随时逐步修改模式,不影响数据库的运行
- 数据操作符统一
- 高度非过程化
- 非关系数据模型的数据操纵语言“面向过程”,必须指定存取路径
- SQL只要提出“做什么”,无须了解存取路径
- 存取路径的选择以及SQL的操作过程由系统自动完成
- 面向集合的操作方式
- 非关系数据模型采用面向记录的操作方式,操作对象是一条记录
- SQL采用集合操作方式
- 操作对象、查找结果可以是元组的集合
- 次插入、删除、更新操作的对象可以是元组的集合
- 以同一种语法结构提供多种使用方式
- SQL是独立的语言,能够独立地用于联机交互的使用方式
- SQL又是嵌入式语言,能够嵌入到高级语言(例如C,C++,Java)程序中,供程序员设计程序时使用
- 语言简洁,易学易用
- SQL功能极强,完成核心功能只用了9个动词:
- 数据定义:CREATE,DROP,ALTER
- 数据查询:SELECT
- 数据操作:INSERT,UPDATE,DELETE
- 数据控制:GRANT,REVOKE
- SQL功能极强,完成核心功能只用了9个动词:
SQL与关系数据库三级模式
- 基本表
- 本身独立存在的表
- 一个关系对应一个基本表
- 一个(或多个)基本表对应一个存储文件
- 一个表可以带若干索引
- 存储文件
- 逻辑结构组成了关系数据库的内模式
- 物理结构对用户是隐蔽的
- 视图
- 从一个或几个基本表导出的表
- 数据库中只存放视图的定义而不存放视图对应的数据
- 视图是一个虚表
- 用户可以在视图上再定义视图
ch12 SQL数据定义
层次化的数据库对象命名机制
- 一个关系数据库管理系统的实例(Instance)中可以建立多个数据库
- 一个数据库中可以建立多个模式
- 一个模式下通常包括多个表、视图和索引等数据库对象
数据定义
- SQL的数据定义功能:
- 模式定义
- 表定义
- 视图和索引的定义
定义模式
- 定义模式实际上定义了一个命名空间。
- 在这个空间中可以定义该模式包含的数据库对象,例如基本表、视图、索引等。
- 在CREATE SCHEMA中可以接受CREATE TABLE,CREATE VIEW和GRANT子句。
- CREATE SCHEMA <模式名> AUTHORIZATION <用户名> [<表定义子句>| <视图定义子句>|<授权定义子句>]
- CREATE SCJE,A “S_T” AUTHORIZATION WANG
删除模式
- DROP SCHEMA <模式名> <CASCADE|RESTRICT>
- CASCADE(级联)
- 删除模式的同时把该模式中所有的数据库对象全部删除
- RESTRICT(限制)
- 如果该模式中定义了下属的数据库对象(如表、视图等),则拒绝该删除语句的执行。
仅当该模式中没有任何下属的对象时才能执行。
- 如果该模式中定义了下属的数据库对象(如表、视图等),则拒绝该删除语句的执行。
- CASCADE(级联)
定义基本表
-
CREATE TABLE <表名>
(<列名> <数据类型>[ <列级完整性约束条件> ]
[,<列名> <数据类型>[ <列级完整性约束条件>] ] -
CREATE TABLE Student
(Sno CHAR(9) PRIMARY KEY
Sname CHAR(20) UNIQUE,
Ssex CHAR(2)
);
数据类型
- SQL中域的概念用数据类型来实现
- 定义表的属性时需要指明其数据类型及长度
- 选用哪种数据类型
数据类型 | 含义 |
---|---|
CHAR(n),CHARACTER(n) | 长度为n的定长字符串 |
VARCHAR(n), CHARACTERVARYING(n) | 最大长度为n的变长字符串 |
CLOB | 字符串大对象 |
BLOB | 二进制大对象 |
INT,INTEGER | **长整数(**4字节) |
SMALLINT | **短整数(**2字节) |
BIGINT | 大整数(8字节) |
NUMERIC(p,d) | 定点数,由p位数字(不包括符号、小数点)组成,小数后面有d位数字 |
DECIMAL(p, d**), DEC(p,** d) | 同NUMERIC |
REAL | 取决于机器精度的单精度浮点数 |
DOUBLE PRECISION | 取决于机器精度的双精度浮点数 |
FLOAT(n) | 可选精度的浮点数,精度至少为n位数字 |
BOOLEAN | 逻辑布尔量 |
DATE | 日期,包含年、月、日,格式为YYYY-MM-DD |
TIME | 时间,包含一日的时、分、秒,格式为HH:MM:SS |
TIMESTAMP | 时间戳类型 |
INTERVAL | 时间间隔类型 |
修改基本表
ALTER TABLE <表名>
[ ADD[COLUMN] <新列名> <数据类型> [ 完整性约束 ] ]
[ ADD <表级完整性约束>]
[ DROP [ COLUMN ] <列名> [CASCADE| RESTRICT] ]
[ DROP CONSTRAINT<完整性约束名>[ RESTRICT | CASCADE ] ]
[ALTER COLUMN <列名><数据类型> ] ;
删除基本表
- DROP TABLE <表名>[RESTRICT| CASCADE];
- RESTRICT:删除表是有限制的。
- 欲删除的基本表不能被其他表的约束所引用
- 如果存在依赖该表的对象,则此表不能被删除
- CASCADE:删除该表没有限制。
- 在删除基本表的同时,相关的依赖对象一起删除
- RESTRICT:删除表是有限制的。
索引
- 建立索引的目的:加快查询速度
- 由数据库管理员或表的拥有者建立
- 由关系数据库管理系统自动完成维护
- 关系数据库管理系统自动使用合适的索引作为存取路径,
- 用户不必也不能显式地选择索引
- 关系数据库管理系统中常见索引:
- 顺序文件上的索引
- B+树索引
- 散列(hash)索引
- 位图索引
建立索引
- 语句格式
CREATE [UNIQUE] [CLUSTER] INDEX <索引名>
ON <表名>(<列名>[<次序>] [,<列名>[<次序>] ]…);- <表名>:要建索引的基本表的名字
- 索引:可以建立在该表的一列或多列上,各列名之间用号分隔
- <次序>:指定索引值的排列次序,升序:ASC,降序:DESC。缺省值:ASC
- UNIQUE:此索引的每一个索引值只对应唯一的数据记录
- CLUSTER:表示要建立的索引是聚簇索引
数据字典
- 数据字典是关系数据库管理系统内部的一组系统表,它记录了
- 数据库中所有定义信息:
- 关系模式定义
- 视图定义
- 索引定义
- 完整性约束定义
- 各类用户对数据库的操作权限
- 统计信息等
- 关系数据库管理系统在执行SQL的数据定义语句时,实际上就是在更新数据字典表中的相应信息
ch13 SQL 数据查询(单表)
- 语句格式
SELECT [ALL|DISTINCT] <目标列表达式>[,<目标列表达式>] …
FROM <表名或视图名>[,<表名或视图名> ]…|(SELECT 语句)
[AS]<别名>
[ WHERE <条件表达式> ]
[GROUP BY <列名1> [ HAVING <条件表达式> ] ]
[ORDER BY <列名2> [ ASC|DESC ] ];
- SELECT子句:指定要显示的属性列
- FROM子句:指定查询对象(基本表或视图)
- WHERE子句:指定查询条件
- GROUP BY子句:对查询结果按指定列的值分组,该属性列值
- 相等的元组为一个组。通常会在每组中作用聚集函数。
- HAVING短语:只有满足指定条件的组才予以输出
- ORDER BY子句:对查询结果表按指定列值的升序或降序排序
查询满足条件的元组
SELECT Sname
FROM Student
WHERE Sdept = 'CS';
-
比较大小
-
确定范围
-
确定集合
- 谓词:IN <值表>, NOT IN <值表>
-
字符匹配
-
谓词: [NOT] LIKE ‘<匹配串>’ [ESCAPE ‘ <换码字符>’]
-
<匹配串>可以是一个完整的字符串,也可以含有通配符%(任意长度(长度可以为0)的字符串)和 _(任意单个字符)
例如:a%b表示以a开头,以b结尾的任意长度的字符串
例如:a_b表示以a开头,以b结尾的长度为3的任意字符串
-
匹配串为固定字符串
- [例3.29] 查询学号为201215121的学生的详细情况。 SELECT * FROM Student WHERE Sno LIKE ‘201215121'; - 等价于: SELECT * FROM Student WHERE Sno = '201215121';
-
匹配串为含通配符的字符串
[例3.30] 查询所有姓刘学生的姓名、学号和性别。 SELECT Sname, Sno, Ssex FROM Student WHERE Sname LIKE '刘%'; [例3.31] 查询姓"欧阳"且全名为三个汉字的学生的姓名。 SELECT Sname FROM Student WHERE Sname LIKE '欧阳__’;
-
使用换码字符将通配符转义为普通字符
-
ESCAPE ‘\’ 表示“ \” 为换码字符
[例3.34] 查询DB_Design课程的课程号和学分。 SELECT Cno,Ccredit FROM Course WHERE Cname LIKE 'DB\_Design' ESCAPE '\ ' ; [例3.35] 查询以"DB_"开头,且倒数第3个字符为 i的课程的详细情况。 SELECT * FROM Course WHERE Cname LIKE 'DB\_%i_ _' ESCAPE '\ ' ;
-
-
-
涉及空值的查询
谓词: IS NULL 或 IS NOT NULL “IS” 不能用 “=” 代替
-
多重条件查询
- 逻辑运算符:AND和 OR来连接多个查询条件
- AND的优先级高于OR
- 可以用括号改变优先级
- 逻辑运算符:AND和 OR来连接多个查询条件
-
对查询结果排序
- ORDER BY子句
- 可以按一个或多个属性列排序
- 升序:ASC;降序:DESC;缺省值为升序
- 对于空值,排序时显示的次序由具体系统实现来决定
- ORDER BY子句
聚集函数
- 聚集函数:
- 统计元组个数
COUNT(*) - 统计一列中值的个数
COUNT([DISTINCT|ALL] <列名>) - 计算一列值的总和(此列必须为数值型)
SUM([DISTINCT|ALL] <列名>) - 计算一列值的平均值(此列必须为数值型)
AVG([DISTINCT|ALL] <列名>) - 求一列中的最大值和最小值
MAX([DISTINCT|ALL] <列名>)
MIN([DISTINCT|ALL] <列名>)
对查询结果分组
- GROUP BY子句分组
- 细化聚集函数的作用对象
- 如果未对查询结果分组,聚集函数将作用于整个查询结果
- 对查询结果分组后,聚集函数将分别作用于每个组
按指定的一列或多列值分组,值相等的为一组
[例3.48 ]查询平均成绩大于等于90分的学生学号和平均成绩
因为WHERE子句中是不能用聚集函数作为条件表达式,下面的语句是不对的:
SELECT Sno, AVG(Grade)
FROM SC
WHERE AVG(Grade)>=90
GROUP BY Sno;
正确的查询语句应该是:
SELECT Sno, AVG(Grade)
FROM SC
GROUP BY Sno
HAVING AVG(Grade)>=90;
ch14 SQL 数据查询(连接)
连接查询
- 连接查询:同时涉及两个以上的表的查询
- 连接条件或连接谓词:用来连接两个表的条件
- 一般格式:
- [<表名1>.]<列名1> <比较运算符> [<表名2>.]<列名2>
- [<表名1>.]<列名1> BETWEEN [<表名2>.]<列名2> AND [<表名2>.]<列名3>
- 连接字段:连接谓词中的列名称
- 连接条件中的各连接字段类型必须是可比的,但名字不必相同
SELECT Student.Sno,Sname,Ssex,Sage,Sdept,Cno,Grade
FROM Student,SC
WHERE Student.Sno = SC.Sno;
连接操作的执行过程
嵌套循环法(NESTED-LOOP)
- 首先在表1中找到第一个元组,然后从头开始扫描表2,逐一查找满足连接件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。
- 表2全部查找完后,再找表1中第二个元组,然后再从头开始扫描表2,逐一查找满足连接条件的元组,找到后就将表1中的第二个元组与该元组拼接起来,形成结果表中一个元组。
- 重复上述操作,直到表1中的全部元组都处理完毕
排序合并法(SORT-MERGE)
- 常用于=连接
- 首先按连接属性对表1和表2排序
- 对表1的第一个元组,从头开始扫描表2,顺序查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。当遇到表2中第一条大于表1连接字段值的元组时,对表2的查询不再继续
索引连接(INDEX-JOIN)
- 对表2按连接字段建立索引
- 对表1中的每个元组,依次根据其连接字段值查询表2的索引,从中找到满足条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组
同时进行连接和选择
[例 3.51]查询选修2号课程且成绩在90分以上的所有学生的学号和姓名。
SELECT Student.Sno, Sname
FROM Student, SC
WHERE Student.Sno=SC.Sno AND
SC.Cno=' 2 ' AND SC.Grade>90;
- 执行过程:
- 先从SC中挑选出Cno='2’并且Grade>90的元组形成一个中间关系
- 再和Student中满足连接条件的元组进行连接得到最终的结果关系
自身连接
-
自身连接:一个表与其自己进行连接
-
需要给表起别名以示区别
-
由于所有属性名都是同名属性,因此必须使用别名前缀
[例 3.52]查询每一门课的间接先修课(即先修课的先修课) SELECT FIRST.Cno, SECOND.Cpno FROM Course FIRST, Course SECOND WHERE FIRST.Cpno = SECOND.Cno;
外连接
- 外连接与普通连接的区别
- 普通连接操作只输出满足连接条件的元组
- 外连接操作以指定表为连接主体,将主体表中不满足连接条件的元组一并输出
- 左外连接
列出左边关系中所有的元组 - 右外连接
列出右边关系中所有的元组
- 左外连接
多表连接
-
多表连接:两个以上的表进行连接
-
[例3.54]查询每个学生的学号、姓名、选修的课程名及成绩
SELECT Student.Sno, Sname, Cname, Grade FROM Student, SC, Course /*多表连接*/ WHERE Student.Sno = SC.Sno AND SC.Cno = Course.Cno;
ch15 SQL数据查询(嵌套)
一个SELECT-FROM-WHERE语句称为一个查询块
将一个查询块嵌套在另一个查询块的WHERE子句或HAVING短语的条件中的查询称为嵌套查询
SELECT Sname /*外层查询/父查询*/
FROM Student
WHERE Sno IN
( SELECT Sno /*内层查询/子查询*/
FROM SC
WHERE Cno= ' 2 ');
- 上层的查询块称为外层查询或父查询
- 下层查询块称为内层查询或子查询
- 子查询的限制
- 不能使用ORDER BY子句
SELECT Sdept
FROM Student
WHERE Sname= ' 刘晨 ';
结果为: CS
SELECT Sno, Sname, Sdept
FROM Student
WHERE Sdept= ' CS ';
SELECT Sno, Sname, Sdept
FROM Student
WHERE Sdept IN
(SELECT Sdept
FROM Student
WHERE Sname= ' 刘晨 ');
- 带有IN谓词的子查询
- 带有比较运算符的子查询
- 带有ANY(SOME)或ALL谓词的子查询
- 带有EXISTS谓词的子查询