数据管理基础-ch11-22

ch11 SQL概述

  • SQL(Structured Query Language)结构化查询语言,是关系数据库的标准语言
  • SQL是一个通用的、功能极强的关系数据库语言
    • 综合统一
    • 高度非过程化
    • 面向集合的操作方式
    • 以同一种语法结构提供两种使用方法
    • 语言简洁,易学易用

SQL的特点

  1. 综合统一
    1. 集数据定义语言(DDL),数据操纵语言(DML),数据控制语言(DCL)功能于一体
    2. 可以独立完成数据库生命周期中的全部活动
    3. 用户数据库投入运行后,可根据需要随时逐步修改模式,不影响数据库的运行
    4. 数据操作符统一
  2. 高度非过程化
    1. 非关系数据模型的数据操纵语言“面向过程”,必须指定存取路径
    2. SQL只要提出“做什么”,无须了解存取路径
    3. 存取路径的选择以及SQL的操作过程由系统自动完成
  3. 面向集合的操作方式
    1. 非关系数据模型采用面向记录的操作方式,操作对象是一条记录
    2. SQL采用集合操作方式
      1. 操作对象、查找结果可以是元组的集合
      2. 次插入、删除、更新操作的对象可以是元组的集合
  4. 以同一种语法结构提供多种使用方式
    1. SQL是独立的语言,能够独立地用于联机交互的使用方式
    2. SQL又是嵌入式语言,能够嵌入到高级语言(例如C,C++,Java)程序中,供程序员设计程序时使用
  5. 语言简洁,易学易用
    1. SQL功能极强,完成核心功能只用了9个动词:
      1. 数据定义:CREATE,DROP,ALTER
      2. 数据查询:SELECT
      3. 数据操作:INSERT,UPDATE,DELETE
      4. 数据控制:GRANT,REVOKE

SQL与关系数据库三级模式

image-20220306101019004

  • 基本表
    • 本身独立存在的表
    • 一个关系对应一个基本表
    • 一个(或多个)基本表对应一个存储文件
    • 一个表可以带若干索引
  • 存储文件
    • 逻辑结构组成了关系数据库的内模式
    • 物理结构对用户是隐蔽的
  • 视图
    • 从一个或几个基本表导出的表
    • 数据库中只存放视图的定义而不存放视图对应的数据
    • 视图是一个虚表
    • 用户可以在视图上再定义视图

ch12 SQL数据定义

层次化的数据库对象命名机制

  • 一个关系数据库管理系统的实例(Instance)中可以建立多个数据库
  • 一个数据库中可以建立多个模式
  • 一个模式下通常包括多个表、视图和索引等数据库对象

image-20220306101233644

数据定义

  • SQL的数据定义功能:
    • 模式定义
    • 表定义
    • 视图和索引的定义

image-20220306101305641

定义模式

  • 定义模式实际上定义了一个命名空间。
    • 在这个空间中可以定义该模式包含的数据库对象,例如基本表、视图、索引等。
  • 在CREATE SCHEMA中可以接受CREATE TABLE,CREATE VIEW和GRANT子句。
    • CREATE SCHEMA <模式名> AUTHORIZATION <用户名> [<表定义子句>| <视图定义子句>|<授权定义子句>]
    • CREATE SCJE,A “S_T” AUTHORIZATION WANG

删除模式

  • DROP SCHEMA <模式名> <CASCADE|RESTRICT>
    • CASCADE(级联)
      • 删除模式的同时把该模式中所有的数据库对象全部删除
    • RESTRICT(限制)
      • 如果该模式中定义了下属的数据库对象(如表、视图等),则拒绝该删除语句的执行。
        仅当该模式中没有任何下属的对象时才能执行。

定义基本表

  • CREATE TABLE <表名>
    (<列名> <数据类型>[ <列级完整性约束条件> ]
    [,<列名> <数据类型>[ <列级完整性约束条件>] ]

  • CREATE TABLE Student

    ​ (Sno CHAR(9) PRIMARY KEY

    ​ Sname CHAR(20) UNIQUE,

    ​ Ssex CHAR(2)

    );

数据类型

  • SQL中域的概念用数据类型来实现
  • 定义表的属性时需要指明其数据类型及长度
  • 选用哪种数据类型
数据类型含义
CHAR(n),CHARACTER(n)长度为n的定长字符串
VARCHAR(n), CHARACTERVARYING(n)最大长度为n的变长字符串
CLOB字符串大对象
BLOB二进制大对象
INT,INTEGER**长整数(**4字节)
SMALLINT**短整数(**2字节)
BIGINT大整数(8字节)
NUMERIC(p,d)定点数,由p位数字(不包括符号、小数点)组成,小数后面有d位数字
DECIMAL(p, d**), DEC(p,** d)NUMERIC
REAL取决于机器精度的单精度浮点数
DOUBLE PRECISION取决于机器精度的双精度浮点数
FLOAT(n)可选精度的浮点数,精度至少为n位数字
BOOLEAN逻辑布尔量
DATE日期,包含年、月、日,格式为YYYY-MM-DD
TIME时间,包含一日的时、分、秒,格式为HH:MM:SS
TIMESTAMP时间戳类型
INTERVAL时间间隔类型

修改基本表

ALTER TABLE <表名>
[ ADD[COLUMN] <新列名> <数据类型> [ 完整性约束 ] ]
[ ADD <表级完整性约束>]
[ DROP [ COLUMN ] <列名> [CASCADE| RESTRICT] ]
[ DROP CONSTRAINT<完整性约束名>[ RESTRICT | CASCADE ] ]
[ALTER COLUMN <列名><数据类型> ] ;

删除基本表

  • DROP TABLE <表名>[RESTRICT| CASCADE];
    • RESTRICT:删除表是有限制的。
      • 欲删除的基本表不能被其他表的约束所引用
      • 如果存在依赖该表的对象,则此表不能被删除
    • CASCADE:删除该表没有限制。
      • 在删除基本表的同时,相关的依赖对象一起删除

索引

  • 建立索引的目的:加快查询速度
    • 由数据库管理员或表的拥有者建立
    • 由关系数据库管理系统自动完成维护
    • 关系数据库管理系统自动使用合适的索引作为存取路径,
    • 用户不必也不能显式地选择索引
  • 关系数据库管理系统中常见索引:
    • 顺序文件上的索引
    • B+树索引
    • 散列(hash)索引
    • 位图索引

建立索引

  • 语句格式
    CREATE [UNIQUE] [CLUSTER] INDEX <索引名>
    ON <表名>(<列名>[<次序>] [,<列名>[<次序>] ]…);
    • <表名>:要建索引的基本表的名字
    • 索引:可以建立在该表的一列或多列上,各列名之间用号分隔
    • <次序>:指定索引值的排列次序,升序:ASC,降序:DESC。缺省值:ASC
    • UNIQUE:此索引的每一个索引值只对应唯一的数据记录
    • CLUSTER:表示要建立的索引是聚簇索引

数据字典

  • 数据字典是关系数据库管理系统内部的一组系统表,它记录了
    • 数据库中所有定义信息:
    • 关系模式定义
    • 视图定义
    • 索引定义
    • 完整性约束定义
    • 各类用户对数据库的操作权限
    • 统计信息等
  • 关系数据库管理系统在执行SQL的数据定义语句时,实际上就是在更新数据字典表中的相应信息

ch13 SQL 数据查询(单表)

  • 语句格式
SELECT [ALL|DISTINCT] <目标列表达式>[,<目标列表达式>]FROM <表名或视图名>[,<表名或视图名> ]|(SELECT 语句) 
                 [AS]<别名>
[ WHERE <条件表达式> ]
[GROUP BY <列名1> [ HAVING <条件表达式> ] ]
[ORDER BY <列名2> [ ASC|DESC ] ];
  • SELECT子句:指定要显示的属性列
  • FROM子句:指定查询对象(基本表或视图)
  • WHERE子句:指定查询条件
  • GROUP BY子句:对查询结果按指定列的值分组,该属性列值
  • 相等的元组为一个组。通常会在每组中作用聚集函数。
  • HAVING短语:只有满足指定条件的组才予以输出
  • ORDER BY子句:对查询结果表按指定列值的升序或降序排序

查询满足条件的元组

SELECT Sname
FROM Student
WHERE Sdept = 'CS';
  1. 比较大小

  2. 确定范围

  3. 确定集合

    • 谓词:IN <值表>, NOT IN <值表>
  4. 字符匹配

    • 谓词: [NOT] LIKE ‘<匹配串>’ [ESCAPE ‘ <换码字符>’]

    • <匹配串>可以是一个完整的字符串,也可以含有通配符%(任意长度(长度可以为0)的字符串)和 _(任意单个字符)

      ​ 例如:a%b表示以a开头,以b结尾的任意长度的字符串

      ​ 例如:a_b表示以a开头,以b结尾的长度为3的任意字符串

    • 匹配串为固定字符串

      - [3.29]  查询学号为201215121的学生的详细情况。
             SELECT *    
             FROM  Student  
             WHERE  Sno LIKE201215121';
      
      - 等价于: 
              SELECT  * 
              FROM  Student 
              WHERE Sno = '201215121';
      
    • 匹配串为含通配符的字符串

      	[3.30]  查询所有姓刘学生的姓名、学号和性别。
      ​      SELECT Sname, Sno, Ssex
      ​      FROM Student
      ​      WHERE  Sname LIKE '刘%';[3.31]  查询姓"欧阳"且全名为三个汉字的学生的姓名。
      ​      SELECT Sname
      ​      FROM   Student
      ​      WHERE  Sname LIKE '欧阳__’;
      
    • 使用换码字符将通配符转义为普通字符

      • ESCAPE ‘\’ 表示“ \” 为换码字符

        [3.34]  查询DB_Design课程的课程号和学分。
             SELECT Cno,Ccredit
             FROM     Course
             WHERE  Cname LIKE 'DB\_Design' ESCAPE '\ ' ;
        [3.35]  查询以"DB_"开头,且倒数第3个字符为 i的课程的详细情况。
              SELECT  *
              FROM    Course
              WHERE  Cname LIKE  'DB\_%i_ _' ESCAPE '\ ' ;
        
        
  5. 涉及空值的查询

    谓词: IS NULLIS NOT NULLIS” 不能用 “=” 代替
    
  6. 多重条件查询

    • 逻辑运算符:AND和 OR来连接多个查询条件
      • AND的优先级高于OR
      • 可以用括号改变优先级
  7. 对查询结果排序

    • ORDER BY子句
      • 可以按一个或多个属性列排序
      • 升序:ASC;降序:DESC;缺省值为升序
      • 对于空值,排序时显示的次序由具体系统实现来决定

聚集函数

  • 聚集函数:
  • 统计元组个数
    COUNT(*)
  • 统计一列中值的个数
    COUNT([DISTINCT|ALL] <列名>)
  • 计算一列值的总和(此列必须为数值型)
    SUM([DISTINCT|ALL] <列名>)
  • 计算一列值的平均值(此列必须为数值型)
    AVG([DISTINCT|ALL] <列名>)
  • 求一列中的最大值和最小值
    MAX([DISTINCT|ALL] <列名>)
    MIN([DISTINCT|ALL] <列名>)

对查询结果分组

  • GROUP BY子句分组
    • 细化聚集函数的作用对象
    • 如果未对查询结果分组,聚集函数将作用于整个查询结果
    • 对查询结果分组后,聚集函数将分别作用于每个组
      按指定的一列或多列值分组,值相等的为一组
[3.48 ]查询平均成绩大于等于90分的学生学号和平均成绩
因为WHERE子句中是不能用聚集函数作为条件表达式,下面的语句是不对的:
    SELECT Sno, AVG(Grade)
    FROM  SC
    WHERE AVG(Grade)>=90
    GROUP BY Sno;
正确的查询语句应该是:
    SELECT  Sno, AVG(Grade)
    FROM  SC
    GROUP BY Sno
    HAVING AVG(Grade)>=90;

ch14 SQL 数据查询(连接)

连接查询

  • 连接查询:同时涉及两个以上的表的查询
  • 连接条件或连接谓词:用来连接两个表的条件
  • 一般格式:
    • [<表名1>.]<列名1> <比较运算符> [<表名2>.]<列名2>
    • [<表名1>.]<列名1> BETWEEN [<表名2>.]<列名2> AND [<表名2>.]<列名3>
  • 连接字段:连接谓词中的列名称
    • 连接条件中的各连接字段类型必须是可比的,但名字不必相同
SELECT  Student.Sno,Sname,Ssex,Sage,Sdept,Cno,Grade
 FROM     Student,SC
 WHERE  Student.Sno = SC.Sno;

连接操作的执行过程

嵌套循环法(NESTED-LOOP)

  • 首先在表1中找到第一个元组,然后从头开始扫描表2,逐一查找满足连接件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。
  • 表2全部查找完后,再找表1中第二个元组,然后再从头开始扫描表2,逐一查找满足连接条件的元组,找到后就将表1中的第二个元组与该元组拼接起来,形成结果表中一个元组。
  • 重复上述操作,直到表1中的全部元组都处理完毕

排序合并法(SORT-MERGE)

  • ​ 常用于=连接
  • 首先按连接属性对表1和表2排序
  • 对表1的第一个元组,从头开始扫描表2,顺序查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。当遇到表2中第一条大于表1连接字段值的元组时,对表2的查询不再继续

索引连接(INDEX-JOIN)

  • 对表2按连接字段建立索引
  • 对表1中的每个元组,依次根据其连接字段值查询表2的索引,从中找到满足条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组

同时进行连接和选择

[3.51]查询选修2号课程且成绩在90分以上的所有学生的学号和姓名。
    SELECT Student.Sno, Sname
    FROM     Student, SC
    WHERE  Student.Sno=SC.Sno  AND    		     
           SC.Cno=' 2 ' AND SC.Grade>90;
  • 执行过程:
    • 先从SC中挑选出Cno='2’并且Grade>90的元组形成一个中间关系
    • 再和Student中满足连接条件的元组进行连接得到最终的结果关系

自身连接

  • 自身连接:一个表与其自己进行连接

  • 需要给表起别名以示区别

  • 由于所有属性名都是同名属性,因此必须使用别名前缀

    [3.52]查询每一门课的间接先修课(即先修课的先修课)
        SELECT  FIRST.Cno, SECOND.Cpno
        FROM  Course  FIRST, Course  SECOND
        WHERE FIRST.Cpno = SECOND.Cno;
    

外连接

  • 外连接与普通连接的区别
    • 普通连接操作只输出满足连接条件的元组
    • 外连接操作以指定表为连接主体,将主体表中不满足连接条件的元组一并输出
      • 左外连接
        列出左边关系中所有的元组
      • 右外连接
        列出右边关系中所有的元组

多表连接

  • 多表连接:两个以上的表进行连接

  • [例3.54]查询每个学生的学号、姓名、选修的课程名及成绩

       SELECT Student.Sno, Sname, Cname, Grade
       FROM    Student, SC, Course    /*多表连接*/
       WHERE Student.Sno = SC.Sno 
               AND SC.Cno = Course.Cno;
    

ch15 SQL数据查询(嵌套)

一个SELECT-FROM-WHERE语句称为一个查询块

将一个查询块嵌套在另一个查询块的WHERE子句或HAVING短语的条件中的查询称为嵌套查询

   SELECT Sname	              /*外层查询/父查询*/
     FROM Student
     WHERE Sno IN
                        ( SELECT Sno        /*内层查询/子查询*/
                          FROM SC
                          WHERE Cno= ' 2 ');
  • 上层的查询块称为外层查询或父查询
  • 下层查询块称为内层查询或子查询
  • 子查询的限制
    • 不能使用ORDER BY子句
SELECT  Sdept  
FROM     Student                            
WHERE  Sname= ' 刘晨 ';
结果为: CS

SELECT   Sno, Sname, Sdept     
FROM      Student                 
WHERE   Sdept= ' CS '; 


SELECT Sno, Sname, Sdept
FROM Student
WHERE Sdept  IN
   (SELECT Sdept
    FROM Student
    WHERE Sname= ' 刘晨 ');

  • 带有IN谓词的子查询
  • 带有比较运算符的子查询
  • 带有ANY(SOME)或ALL谓词的子查询
  • 带有EXISTS谓词的子查询
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值