- 本笔记为阿里云天池龙珠计划SQL训练营的学习内容,链接为:https://tianchi.aliyun.com/specials/promotion/aicampsql
一、初识数据库
数据库是将大量数据保存起来,通过计算机加工而成的可以进行高效访问的数据集合。该数据集合称为数据库(Database,DB)。用来管理数据库的计算机系统称为数据库管理系统(Database Management System,DBMS)。
1.1 DBMS的种类
DBMS主要通过数据的保存格式来进行分类,目前主要有以下5种类型。
- 层次数据库(Hierarchical Database, HDB)
- 关系数据库(Relational Database, RDB)
- 面向对象数据库(Object Oriented Database, OODB)
- XML数据库(XML Database. XMLDB)
- 键值存储系统(Key-Value Store, KVS)
其中,关系数据库类型的DBMS称为关系数据库管理系统(RDBMS),比较有代表性的有Oracle、SQL Server、DB2、PostgreSQL、MySQL等。
1.2 RDBMS的常见系统结构
RDBMS最常见的系统结构是客户端-服务器类型(C-S类型)的结构,即客户端在需要访问数据库时,客户端将通过SQL语句访问数据库服务器,再由服务器返回相应的请求的数据。
二、初识SQL
2.1 概念介绍
数据库中存储的表的结构类似于Excel中的行和列。但是,在数据库中,Excel中的“行”称为“记录”,即这一行时一条记录。而“列”被称为“字段”,它代表了表中存储的数据项目。行(记录)和列(字段)的交汇处称为单元格,一个单元格中只能输入一条记录。
SQL是为操作数据库而开发的语言,ISO为 SQL 制定了相应的标准,以此为基准的SQL 称为标准 SQL。完全基于标准 SQL 的 RDBMS 很少,通常需要根据不同的 RDBMS 来编写特定的 SQL 语句。
根据对 RDBMS 赋予的指令种类的不同,SQL 语句可以分为DDL、DML、DCL以下三类
DDL(Data Definition Language,数据定义语言)
用来创建或者删除存储数据用的数据库以及数据库中的表等对象。包含以下几种指令:
- CREATE:创建数据库、表等对象
- DROP:删除对象
- ALTER:修改对象的结构
DML(Data Manipulation Language,数据操纵语言)
用来查询或者变更表中记录。包含以下几种指令。
- SELECT:查询表中数据
- INSERT:向表中插入数据
- UPDATE:更新表中数据
- DELETE:删除表中数据
DCL(Data Control Language,数据控制语言)
用来确认或者取消对数据库中的数据进行的变更。除此之外,还可以设定 RDBMS 用户是否有权限操作数据库中的对象(数据库表等)。包含以下几种指令。
- COMMIT:确认对数据库的数据进行变更
- ROLLBACK:取消对数据库中的数据进行变更
- GRANT:赋予用户操作权限
- REVOKE:取消用户操作权限
实际使用的 SQL 语句当中绝大多数属于 DML
2.2 SQL的基本书写规则
- 语句以分号( ; )结尾
- SQL 不区分关键字的大小写,但是插入到表中的数据是区分大小写的
- Win 系统默认不区分表名及字段名的大小写,linux / mac 默认严格区分表名及字段名的大小写
- 常数书写方式固定
2.3 数据库的创建(CREATE DATABASE语句)
语法:
CREATE DATABASE < 数据库名称 > ;
创建本课程使用的数据库:
CREATE DATABASE shop;
2.4 表的创建(CREATE TABLE语句)
语法:
CREATE TABLE < 表名 >
( < 列名 1> < 数据类型 > < 该列所需约束 > ,
< 列名 2> < 数据类型 > < 该列所需约束 > ,
< 列名 3> < 数据类型 > < 该列所需约束 > ,
< 列名 4> < 数据类型 > < 该列所需约束 > ,
.
.
.
< 该表的约束 1> , < 该表的约束 2> ,……);
创建本课程用到的商品表:
-- 如果还存在别的数据库,需要加上"USE shop;"
CREATE TABLE product(
product_id CHAR(4) NOT NULL,
product_name VARCHAR(100) NOT NULL,
product_type VARCHAR(32) NOT NULL,
sale_price INTEGER,
purchase_price INTEGER,
regist_date DATE,
PRIMARY KEY(product_id)
) ;
商品表和product表列名对应关系
商品表中的列名 | product表定义的列名 |
商品编号 | product_id |
商品名称 | product_name |
商品种类 | product_type |
销售单价 | sale_price |
进货单价 | purchase_price |
登记日期 | regist_date |
2.5 SQL命名规则
- 只能使用半角英文字母、数字、下划线(_)作为数据库、表和列的名称
- 名称必须以半角英文字母开头
2.6 数据类型的指定
数据库创建的表,所有的列都必须指定数据类型,每一列都不能存储与该列数据类型不符的数据。
四种基本数据类型
- INTEGER型:整数
用来指定存储整数的列的数据类型(数字型),不能存储小数。
- CHAR型:定长字符串
用来存储定长字符串,当列中存储的字符串长度达不到最大长度的时候,使用半角空格进行补足,由于会浪费存储空间,所以一般不使用。
- VARCHAR型:可变长字符串
用来存储可变长度字符串,定长字符串在字符数未达到最大长度时会用半角空格补足,但可变长字符串不同,即使字符数未达到最大长度,也不会用半角空格补足。
- DATE型:日期
用来指定存储日期(年月日)的列的数据类型(日期型)。
2.7 约束的设置
约束是除了数据类型之外,对列中存储的数据进行限制或者追加条件的功能。
NOT NULL是非空约束,即该列必须输入数据,不能为空。
PRIMARY KEY是主键约束,代表该列是唯一值,可以通过该列取出特定的行的数据。
2.8 表的删除和更新
- 删除表的语法:
需要特别注意的是,删除的表是无法恢复的,只能重新插入,请执行删除操作时需谨慎。
DROP TABLE < 表名 > ;
删除 product 表:
DROP TABLE product
- 添加列的 ALTER TABLE 语句:
ALTER TABLE < 表名 > ADD COLUMN < 列的定义 >;
添加一列可以存储100位的可变长字符串的 product_name_pinyin 列:
ALTER TABLE product ADD COLUMN product_name_pinyin VARCHAR(100);
- 删除列的 ALTER TABLE 语句:
ALTER TABLE 语句和 DROP TABLE 语句一样,执行之后无法恢复。误添的列可以通过 ALTER TABLE 语句删除,或者将表全部删除之后重新再创建。
ALTER TABLE < 表名 > DROP COLUMN < 列名 >;
删除 product_name_pinyin 列:
ALTER TABLE product DROP COLUMN product_name_pinyin;
扩展内容
- 清空表内容:
TRUNCATE TABLE TABLE_NAME;
优点:相比drop``/``delete
,truncate
用来清除数据时,速度最快。
- 数据的更新:
UPDATE <表名>
SET <列名> = <表达式> [, <列名2>=<表达式2>...];
WHERE <条件>; -- 可选,非常重要。
ORDER BY 子句; --可选
LIMIT 子句; --可选
使用 update 时要注意添加 where 条件,否则将会将所有的行按照语句修改。
-- 修改所有的注册时间
UPDATE product
SET regist_date = '2009-10-10';
-- 仅修改部分商品(商品种类为厨房用具的商品)的单价
UPDATE product
SET sale_price = sale_price * 10
WHERE product_type = '厨房用具';
使用 UPDATE 也可以将列更新为 NULL(该更新俗称为NULL清空)。此时只需要将赋值表达式右边的值直接写为 NULL 即可。
-- 将商品编号为0008的数据(圆珠笔)的登记日期更新为NULL
UPDATE product
SET regist_date = NULL
WHERE product_id = '0008';
和INSERT语句一样, UPDATE语句也可以将NULL作为一个值来使用。但是,只有未设置NOT NULL约束和主键约束的列才可以清空为NULL。如果将设置了上述约束的列更新为 NULL,就会出错,这点与INSERT语句相同。
多列更新
UPDATE 语句的 SET 子句支持同时将多个列作为更新对象。
-- 基础写法,一条UPDATE语句只更新一列
UPDATE product
SET sale_price = sale_price * 10
WHERE product_type = '厨房用具';
UPDATE product
SET purchase_price = purchase_price / 2
WHERE product_type = '厨房用具';
该写法可以得到正确结果,但是代码较为繁琐。可以采用合并的方法来简化代码。
-- 合并后的写法,一个UPDATE语句可以更新多列语句
UPDATE product
SET sale_price = sale_price * 10,
purchase_price = purchase_price / 2
WHERE product_type = '厨房用具';
SET 子句中的列不仅可以是两列,还可以是三列或者更多。
2.9 向product表中插入数据
为了学习INSERT语句用法,我们首先创建一个名为productins的表,建表语句如下:
CREATE TABLE productins
(product_id CHAR(4) NOT NULL,
product_name VARCHAR(100) NOT NULL,
product_type VARCHAR(32) NOT NULL,
sale_price INTEGER DEFAULT 0,
purchase_price INTEGER ,
regist_date DATE ,
PRIMARY KEY (product_id));
基本语法:
INSERT INTO <表名> (列1, 列2, 列3, ……) VALUES (值1, 值2, 值3, ……);
对表进行全列 INSERT 时,可以省略表名后的列清单。这时 VALUES子句的值会默认按照从左到右的顺序赋给每一列。
-- 包含列清单
INSERT INTO productins (product_id, product_name, product_type,
sale_price, purchase_price, regist_date) VALUES ('0005', '高压锅', '厨房用具', 6800, 5000, '2009-01-15');
-- 省略列清单
INSERT INTO productins
VALUES ('0005', '高压锅', '厨房用具', 6800, 5000, '2009-01-15');
原则上,执行一次 INSERT 语句会插入一行数据。插入多行时,通常需要循环执行相应次数的 INSERT 语句。但很多 RDBMS 都支持一次插入多行数据。
-- 通常的INSERT
INSERT INTO productins VALUES ('0002', '打孔器',
'办公用品', 500, 320, '2009-09-11');
INSERT INTO productins VALUES ('0003', '运动T恤',
'衣服', 4000, 2800, NULL);
INSERT INTO productins VALUES ('0004', '菜刀',
'厨房用具', 3000, 2800, '2009-09-20');
-- 多行INSERT ( DB2、SQL、SQL Server、 PostgreSQL 和 MySQL多行插入)
INSERT INTO productins VALUES ('0002', '打孔器',
'办公用品', 500, 320, '2009-09-11'),
('0003', '运动T恤', '衣服', 4000, 2800, NULL),
('0004', '菜刀', '厨房用具', 3000, 2800, '2009-09-20');
-- Oracle中的多行INSERT
INSERT ALL INTO productins VALUES ('0002', '打孔器', '办公用品', 500, 320, '2009-09-11')
INTO productins VALUES ('0003', '运动T恤', '衣服', 4000, 2800, NULL)
INTO productins VALUES ('0004', '菜刀', '厨房用具', 3000, 2800, '2009-09-20')
SELECT * FROM DUAL;
-- DUAL是Oracle特有(安装时的必选项)的一种临时表A。因此“SELECT *FROM DUAL” 部分也只是临时性的,并没有实际意义。
INSERT 语句中想给某一列赋予 NULL 值时,可以直接在 VALUES子句的值清单中写入 NULL。想要插入 NULL 的列一定不能设置 NOT NULL 约束。
INSERT INTO productins (product_id, product_name, product_type,
sale_price, purchase_price, regist_date) VALUES ('0006', '叉子',
'厨房用具', 500, NULL, '2009-09-20');
还可以向表中插入默认值(初始值)。可以通过在创建表的CREATE TABLE 语句中设置DEFAULT约束来设定默认值。
CREATE TABLE productins
(product_id CHAR(4) NOT NULL,
(略)
sale_price INTEGER
(略) DEFAULT 0, -- 销售单价的默认值设定为0;
PRIMARY KEY (product_id));
可以使用INSERT … SELECT 语句从其他表复制数据。
-- 将商品表中的数据复制到商品复制表中
INSERT INTO productocpy (product_id, product_name, product_type, sale_price, purchase_price, regist_date)
SELECT product_id, product_name, product_type, sale_price,
purchase_price, regist_date
FROM Product;
本课程用表插入数据sql如下:
- DML :插入数据
STARTTRANSACTION;
INSERT INTO product VALUES('0001', 'T恤衫', '衣服', 1000, 500, '2009-09-20');
INSERT INTO product VALUES('0002', '打孔器', '办公用品', 500, 320, '2009-09-11');
INSERT INTO product VALUES('0003', '运动T恤', '衣服', 4000, 2800, NULL);
INSERT INTO product VALUES('0004', '菜刀', '厨房用具', 3000, 2800, '2009-09-20');
INSERT INTO product VALUES('0005', '高压锅', '厨房用具', 6800, 5000, '2009-01-15');
INSERT INTO product VALUES('0006', '叉子', '厨房用具', 500, NULL, '2009-09-20');
INSERT INTO product VALUES('0007', '擦菜板', '厨房用具', 880, 790, '2008-04-28');
INSERT INTO product VALUES('0008', '圆珠笔', '办公用品', 100, NULL, '2009-11-11');
COMMIT;
三、练习题
3.1
编写一条CREATE TABLE语句,用来创建一个包含表中所列各项的表Addressbook(地址簿),并为regist_no(注册编号)列设置主键约束。
CREATE TABLE addressbook
(regist_no INTEGER NOT NULL,
namr VARCHAR(128) NOT NULL,
address VARCHAR(256) NOT NULL,
tel_no CHAR(10),
mail_address CHAR(20),
PRIMARY KEY (regist_no));
3.2
假设在创建练习1.1中的 Addressbook 表时忘记添加如下一列postal_code(邮政编码)了,请把此列添加到Addressbook表中。
列名:postal_code
数据类型:定长字符串类型(长度为 8)
约束:不能为NULL
ALTER TABLE addressbook ADD COLUMN postal_code CHAR(10);
3.3
编写 SQL 语句来删除Addressbook表。
DROP TABLE addressbook;
3.4
编写 SQL 语句来恢复删除掉的Addressbook表。
CREATE TABLE addressbook
(regist_no INTEGER NOT NULL,
namr VARCHAR(128) NOT NULL,
address VARCHAR(256) NOT NULL,
tel_no CHAR(10),
mail_address CHAR(20),
postal_code CHAR(10),
PRIMARY KEY (regist_no));