1. 初识数据库
- 数据的集合称为数据库(Database,DB)。
- ⽤来管理数据库的计算机系统称为数据库管理系统
(Database Management System,DBMS)。
1.1 DB和DBMS的种类
DBMS 主要通过数据的保存格式(数据库的种类)来进⾏分类,数据库的种类有以下五种:
- 层次数据库(Hierarchical Database,HDB)
- 关系数据库(Relational Database,RDB)
- 面向对象数据库(Object Oriented Database,OODB)
- XML数据库(XML Database,XMLDB)
- 键值存储系统(Key-Value Store,KVS)
比较具有代表性的 RDBMS 有如下 5 种。
- Oracle Database:甲⻣⽂公司的RDBMS
- SQL Server:微软公司的RDBMS
- DB2:IBM公司的RDBMS
- PostgreSQL:开源的RDBMS
- MySQL:开源的RDBMS
本课程使⽤ SQL 语⾔的关系数据库管理系统(RDBMS)的操作⽅法。
1.2 RDBMS常见的系统结构
使⽤ RDBMS 时,最常⻅的系统结构就是客户端 / 服务器类型(C/S类型)这种结构。
2. 初识SQL
2.1 标准术语
- 在数据库中,⾏称为记录,列称为字段。
- 行和列交汇的地⽅称为单元格,⼀个单元格中只能输⼊⼀条记录
2.2 SQL语句类别
根据对 RDBMS 赋予的指令种类的不同,SQL 语句可以分为以下三类:
DDL(Data Definition Language,数据定义语言) 用来创建或者删除存储数据⽤的数据库以及数据库中的表等对象。DDL包含以下几种指令。
- CREATE : 创建数据库和表等对象
- DROP : 删除数据库和表等对象
- ALTER : 修改数据库和表等对象的结构
DML(Data Manipulation Language,数据操纵语⾔) ⽤来查询或者变更表中的记录。DML
包含以下⼏种指令。
- SELECT :查询表中的数据
- INSERT :向表中插⼊新数据
- UPDATE :更新表中的数据
- DELETE :删除表中的数据
DCL(Data Control Language,数据控制语言) 用来确认或者取消对数据库中的数据进行的变更。除此之外,还可以对 RDBMS 的用户是否有权限操作数据库中的对象(数据库表等)进行设定。DCL 包含以下几种指令。
- COMMIT : 确认对数据库中的数据进行的变更
- ROLLBACK : 取消对数据库中的数据进⾏的变更
- GRANT : 赋予⽤户操作权限
- REVOKE : 取消⽤户的操作权限
实际使用的 SQL 语句当中有 90% 属于 DML。
2.3 SQL的基本书写规则
-
语句结尾:SQL语句要以分号( ; )结尾
-
大小写:SQL 不区分关键字的大小写,但是插入到表中的数据是区分大小写的;win 系统默认不区分表名及字段名的大小写;linux / mac 默认严格区分表名及字段名的大小写。
(本教程已统⼀调整表名及字段名的为小写,以方便初学者学习使用。) -
常数书写:常数的书写方式固定: ‘abc’, 1234, ‘26 Jan 2010’, ‘10/01/26’, ‘2010-01-26’…
-
半角空格:单词需要用半角空格或者换行来分隔
2.4 创建数据库 CREATE DATABASE
CREATE DATABASE < 数据库名称 > ;
例:创建一个商店的数据库
CREATE DATABASE shop;
2.5 表的创建 CREATE TABLE
CREATE TABLE < 表名 >
( < 列名 1> < 数据类型 > < 该列所需约束 > ,
< 列名 2> < 数据类型 > < 该列所需约束 > ,
< 列名 3> < 数据类型 > < 该列所需约束 > ,
< 列名 4> < 数据类型 > < 该列所需约束 > ,
.
.
.
< 该表的约束 1> , < 该表的约束 2> ,……);
例:创建一个商品表
CREATE TABLE product
(product_id CHAR(4) NOT NULL,
product_name VARCHAR(100) NOT NULL,
product_type VARCHAR(32) NOT NULL,
sale_price INTEGER ,
purchase_price INTEGER ,
regist_date DATE ,
PRIMARY KEY (product_id));
2.5.1 命名规则
- 只能使⽤半⻆英⽂字⺟、数字、下划线(_)作为数据库、表和列的名称
- 名称必须以半⻆英⽂字⺟开头
2.5.2 数据类型的指定
数据库创建的表,所有的列都必须指定数据类型,每⼀列都不能存储与该列数据类型不符的数据。
- INTEGER 型
指定存储整数列的一种数据类型(数字型),不能存储小数。
- CHAR 型
存储定长字符串,不足长用半角空格补足,会浪费存储空间,⼀般不使用。
- VARCHAR 型
存储可变长度字符串。
- DATE 型
指定存储日期(年月日)的列的数据类型(日期型)。
2.5.3 约束的设置
- NOT NULL 是非空约束,即该列必须输⼊数据。
- PRIMARY KEY 是主键约束,代表该列是唯⼀值,可以通过该列取出特定的行的数据。
2.5.4 表的删除和更新
2.5.4.1 删除表
删除表的语法:
DROP TABLE < 表名 >
例:删除 product 表
删除的表无法恢复,执行删除操作时要非常谨慎。
DROP TABLE product;
2.5.4.2 更新表
2.5.4.2.1 用ALTER TABLE更新表(增删列)
- 添加列(ALTER TABLE)
ALTER TABLE < 表名 > ADD COLUMN < 列的定义 >;
例:添加⼀列可以存储100位的可变⻓字符串的 product_name_pinyin 列
ALTER TABLE product ADD COLUMN product_name_pinyin VARCHAR(100);
- 删除列(ALTER TABLE)
ALTER TABLE < 表名 > DROP COLUMN < 列名 >;
例: 删除 product_name_pinyin 列
ALTER TABLE product DROP COLUMN product_name_pinyin;
ALTER TABLE 语句和 DROP TABLE 语句⼀样,执行之后无法恢复。误添的列可以通过ALTER TABLE 语句删除,或者将表全部删除之后重新再创建。
2.5.4.2.2 用TRUNCATE清空表
- 清空表内容
TRUNCATE TABLE TABLE_NAME;
优点:相比 drop / delete , truncate 清除数据速度最快。
2.5.4.2.3 用UPDATE清空表和更新表(单列多列更新)
- 更新表
UPDATE <表名>
SET <列名> = <表达式> [, <列名2>=<表达式2>...];
WHERE <条件>; -- 可选,非常重要。
ORDER BY 子句; --可选
LIMIT 子句; --可选
例:使⽤ update 时要注意添加 where 条件,否则将会将所有的行按照语句修改。
- 清空表
使用 UPDATE 也可以将列更新为 NULL(该更新俗称为 NULL 清空)。此时只需要将赋值表达式右边的值直接写为 NULL 即可。
-- 将商品编号为0008的数据(圆珠笔)的登记日期更新为NULL
UPDATE product
SET regist_date = NULL
WHERE product_id = '0008';
和 INSERT 语句⼀样, UPDATE 语句也可将 NULL 作为⼀个值。
但是,如果将设置了 “NOT NULL 约束”和“主键约束”的列更新为 NULL,就会出错。
- 多列更新
(1)简单版:
UPDATE 语句的 SET 子句支持同时将多个列作为更新对象。
-- 基础写法,一条UPDATE语句只更新一列
UPDATE product
SET sale_price = sale_price * 10
WHERE product_type = '厨房用具';
UPDATE product
SET purchase_price = purchase_price / 2
WHERE product_type = '厨房用具';
该写法可以得到正确结果,但是代码较为繁琐。可以采用合并的方法来简化代码。
(2)合并版:
-- 合并后的写法
UPDATE product
SET sale_price = sale_price * 10,
purchase_price = purchase_price / 2
WHERE product_type = '厨房用具';
SET 子句中的列还可以是三列或者更多。
2.5.4.2.1 用INSERT插入数据
- 插入一行数据
INSERT INTO <表名> (列1, 列2, 列3, ……) VALUES (值1, 值2, 值3, ……);
对表进行全列 INSERT 时,可以省略表名后的列清单。这时 VALUES子句的值会默认按照从左到右的顺序赋给每⼀列。
-- 包含列清单
INSERT INTO ProductIns (product_id, product_name, product_type,sale_price, purchase_price, regist_date)
VALUES ('0005', '高压锅','厨房用具', 6800, 5000, '2009-01-15');
-- 省略列清单
INSERT INTO ProductIns
VALUES ('0005', '高压锅', '厨房用具', 6800, 5000, '2009-01-15');
- 插入多行数据
原则上,执行一次 INSERT插⼊一行数据。插入多行需要循环执行多次 INSERT 。其实很多 RDBMS 都支持一次插⼊多行数据。
-- 通常的INSERT
INSERT INTO ProductIns VALUES ('0002', '打孔器','办公用品', 500, 320, '2009-09-11');
INSERT INTO ProductIns VALUES ('0003', '运动T恤','衣服', 4000, 2800, NULL);
INSERT INTO ProductIns VALUES ('0004', '菜刀', '厨房用具', 3000, 2800, '2009-09-20');
-- 多行INSERT ( DB2、SQL、SQL Server、 PostgreSQL 和 MySQL多行插入)
INSERT INTO ProductIns VALUES ('0002', '打孔器','办公用品', 500, 320, '2009-09-11'),
('0003', '运动T恤', '衣服', 4000, 2800, NULL),
('0004', '菜刀', '厨房用具', 3000, 2800, '2009-09-20');
-- Oracle中的多行INSERT
INSERT ALL INTO ProductIns VALUES ('0002', '打孔器', '办公用品', 500, 320,'2009-09-11')
INTO ProductIns VALUES ('0003', '运动T恤', '衣服', 4000, 2800, NULL)
INTO ProductIns VALUES ('0004', '菜刀', '厨房用具', 3000, 2800, '2009-09-20')
SELECT * FROM DUAL;
-- DUAL是Oracle特有(安装时的必选项)的一种临时表A。因此“SELECT *FROM DUAL” 部分
也只是临时性的,并没有实际意义。
- 插入NULL
INSERT 语句中可直接在 VALUES子句的值清单中写入NULL。想要插入 NULL 的列不能设置 NOT NULL 约束。
INSERT INTO ProductIns (product_id, product_name, product_type,sale_price, purchase_price, regist_date)
VALUES ('0006', '叉子','厨房用具', 500, NULL, '2009-09-20');
- 从其他表复制数据(INSERT…SELECT)
-- 将商品表中的数据复制到商品复制表中
INSERT INTO ProductCopy (product_id, product_name, product_type,sale_price, purchase_price, regist_date)
SELECT product_id, product_name, product_type, sale_price,purchase_price, regist_date
FROM Product;
插入所有数据的时候出现了这样的问题:
原因在于曾insert一次0001数据,而主键是不能重复的,所以需要跳过0001数据即可。
截取最后几行,上面省略:
2.5.4.2.1 用CREATE TABLE …DEFAULT设置默认值(初始值)
还可以向表中插⼊默认值(初始值)。可以通过在创建表的CREATE TABLE 语句中设置DEFAULT 约束来设定默认值。
CREATE TABLE ProductIns
(product_id CHAR(4) NOT NULL,
(略)
sale_price INTEGER
(略) DEFAULT 0, -- 销售单价的默认值设定为0;
PRIMARY KEY (product_id));
如果已经创建了表,需要为列添加默认值的话,可以输入如下语句(MySQL):
ALTER TABLE product
ALTER sale_price SET DEFAULT 0;
输出结果:
关于默认值设置的参考链接在此。
本课程用表插入数据如下:
- DML :插入数据
STARTTRANSACTION;
INSERT INTO product VALUES('0001', 'T恤衫', '衣服', 1000, 500, '2009-09-20');
INSERT INTO product VALUES('0002', '打孔器', '办公用品', 500, 320, '2009-09-11');
INSERT INTO product VALUES('0003', '运动T恤', '衣服', 4000, 2800, NULL);
INSERT INTO product VALUES('0004', '菜刀', '厨房用具',3000, 2800, '2009-09-20');
INSERT INTO product VALUES('0005', '高压锅', '厨房用具', 6800, 5000, '2009-01-15');
INSERT INTO product VALUES('0006', '叉子', '厨房用具', 500, NULL, '2009-09-20');
INSERT INTO product VALUES('0007', '擦菜板', '厨房用具', 880, 790, '2008-04-28');
INSERT INTO product VALUES('0008', '圆珠笔', '办公用品', 100, NULL, '2009-11-11');
COMMIT;
3. 练习题
3.1 创建表
编写⼀条 CREATE TABLE 语句,⽤来创建⼀个包含表 1-A 中所列各项的表 Addressbook(地址簿),并为 regist_no (注册编号)列设置主键约束
还是使用之前例子中创建的数据库shop:
use shop;
CREATE TABLE Addressbook
(regist_no INTEGER NOT NULL,
name VARCHAR(128) NOT NULL,
address VARCHAR(256) NOT NULL,
tel_no CHAR(10) ,
mail_address CHAR(20) ,
PRIMARY KEY (regist_no));
3.2 插入列
假设在创建练习1.1中的 Addressbook 表时忘记添加如下⼀列 postal_code (邮政编码)了,请把此列添加到Addressbook 表中。
- 列名 : postal_code
- 数据类型 :定长字符串类型(长度为 8)
- 约束 :不能为 NULL
ALTER TABLE Addressbook ADD COLUMN postal_code CHAR(8) NOT NULL;
INSERT INTO Addressbook VALUES (1,"Liuchang","aaaaaa","bbbbbb","cccccc","dddddd");
SELECT * FROM Addressbook;
1.3
编写 SQL 语句来删除 Addressbook 表。
DROP TABLE Addressbook;
1.4
编写 SQL 语句来恢复删除掉的 Addressbook 表。
CREATE TABLE Addressbook
(regist_no INTEGER NOT NULL,
name VARCHAR(128) NOT NULL,
address VARCHAR(256) NOT NULL,
tel_no CHAR(10) ,
mail_address CHAR(20) ,
PRIMARY KEY (regist_no));