1 初识数据库
数据库(Database,DB)是将大量数据保存起来,通过计算机加工而成的可以进行高效访问的数据集合。
数据库管理系统(Database Management System,DBMS):用来管理数据库的计算机系统。
2 数据库管理系统
DBMS主要通过数据的保存格式(数据库的种类)来进行分类
-
层次数据库(Hierarchical Database,HDB)
-
关系数据库(Relational Database,RDB):由行和列组成的二维表来管理数据
Oracle Database | 甲骨文公司的RDBMS |
SQL Server | 微软公司的RDBMS |
DB2 | IBM的RDBMS |
PostgreSQL | 开源的RDBMS |
MySQL | 开源的RDBMS |
-
面向对象数据库(Object Oriented Database,OODB)
-
XML数据库(XML Database,XMLDB)
-
键值存储系统(Key-Value Store,KVS),举例:MongoDB
3 初识SQL
在数据库中,行称为记录,它相当于一条记录,列称为字段,它代表了表中存储的数据项目。
行和列交汇的地方称为单元格,一个单元格中只能输入一条记录。
根据对 RDBMS 赋予的指令种类的不同,SQL 语句可以分为以下三类:
- DDL(Data Definition Language,数据定义语言) :用来创建或者删除存储数据用的数据库以及数据库中的表等对象。DDL 包含以下几种指令。
CREATE 创建数据库和表等对象 DROP 删除数据库和表等对象 ALTER 修改数据库和表等对象的结构 - DML(Data Manipulation Language,数据操纵语言) 用来查询或者变更表中的记录。DML 包含以下几种指令。
SELECT
查询表中的数据 INSERT 向表中插入新数据 UPDATE 更新表中的数据 DELETE 删除表中的数据 -
DCL(Data Control Language,数据控制语言) 用来确认或者取消对数据库中的数据进行的变更。除此之外,还可以对 RDBMS 的用户是否有权限操作数据库中的对象(数据库表等)进行设定。DCL 包含以下几种指令。
COMMIT
确认对数据库中的数据进行的变更 ROLLBACK 取消对数据库中的数据进行的变更 GRANT 赋予用户操作权限 REVOKE 取消用户的操作权限
3.1 基本书写规则
- SQL语句要以分号( ; )结尾
- SQL 不区分关键字的大小写,但是插入到表中的数据是区分大小写的
- win 系统默认不区分表名及字段名的大小写
- linux / mac 默认严格区分表名及字段名的大小写
- 常数的书写方式是固定的:'abc', 1234, '26 Jan 2010', '10/01/26', '2010-01-26'......
- 单词需要用半角空格或者换行来分隔
3.2 数据库的创建( CREATE DATABASE 语句)
CREATE DATABASE < 数据库名称 > ;
CREATE DATABASE shop;
3.3 表的创建( CREATE DATABASE 语句)
CREATE TABLE < 表名 >
( < 列名 1> < 数据类型 > < 该列所需约束 > ,
< 列名 2> < 数据类型 > < 该列所需约束 > ,
< 列名 3> < 数据类型 > < 该列所需约束 > ,
< 列名 4> < 数据类型 > < 该列所需约束 > ,
.
.
.
< 该表的约束 1> , < 该表的约束 2> ,……);
CREATE TABLE product
(product_id CHAR(4) NOT NULL,
product_name VARCHAR(100) NOT NULL,
product_type VARCHAR(32) NOT NULL,
sale_price INTEGER ,
purchase_price INTEGER ,
regist_date DATE ,
PRIMARY KEY (product_id));
3.4 命名规则
- 只能使用半角英文字母、数字、下划线(_)作为数据库、表和列的名称
- 名称必须以半角英文字母开头
3.5 数据类型的指定
数据库创建的表,所有的列都必须指定数据类型,每一列都不能存储与该列数据类型不符的数据。
四种最基本的数据类型:
- INTEGER 型:用来指定存储整数的列的数据类型(数字型),不能存储小数。
- CHAR 型:用来存储定长字符串,当列中存储的字符串长度达不到最大长度的时候,使用半角空格进行补足,由于会浪费存储空间,所以一般不使用。
- VARCHAR 型:用来存储可变长度字符串,定长字符串在字符数未达到最大长度时会用半角空格补足,但可变长字符串不同,即使字符数未达到最大长度,也不会用半角空格补足。
- DATE 型:用来指定存储日期(年月日)的列的数据类型(日期型)。
3.6 约束的设置
除了数据类型之外,对列中存储的数据进行限制或者追加条件的功能
NOT NULL | 非空约束,即该列必须输入数据 |
PRIMARY KEY | 主键约束,代表该列是唯一值,可以通过该列取出特定的行的数据 |
3.7 表的删除和更新
- 删除表
DROP TABLE <表名>;
DROP TABLE product;
- 添加列
ALTER TABLE < 表名 > ADD COLUMN < 列的定义 >;
ALTER TABLE product ADD COLUMN product_name_pinyin VARCHAR(100);
- 删除列
ALTER TABLE < 表名 > DROP COLUMN < 列名 >;
ALTER TABLE product DROP COLUMN product_name_pinyin;
- 删除特定行
DELETE FROM product WHERE COLUMN_NAME='XXX';
- 清空表内容
TRUNCATE TABLE TABLE_NAME;
- 数据更新
UPDATE <表名>
SET <列名> = <表达式> [, <列名2>=<表达式2>...];
WHERE <条件>; -- 可选,非常重要。
ORDER BY 子句; --可选
LIMIT 子句; --可选
-- 修改所有的注册时间
UPDATE product
SET regist_date = '2009-10-10';
-- 仅修改部分商品的单价
UPDATE product
SET sale_price = sale_price * 10
WHERE product_type = '厨房用具';
-- 将商品编号为0008的数据(圆珠笔)的登记日期更新为NULL
UPDATE product
SET regist_date = NULL
WHERE product_id = '0008';
UPDATE product
SET sale_price = sale_price * 10,
purchase_price = purchase_price / 2
WHERE product_type = '厨房用具';
3.7 向表中插入数据
CREATE TABLE productins
(product_id CHAR(4) NOT NULL,
product_name VARCHAR(100) NOT NULL,
product_type VARCHAR(32) NOT NULL,
sale_price INTEGER DEFAULT 0,
purchase_price INTEGER ,
regist_date DATE ,
PRIMARY KEY (product_id));
INSERT INTO <表名> (列1, 列2, 列3, ……) VALUES (值1, 值2, 值3, ……);
INSERT INTO productins VALUES ('0002', '打孔器', '办公用品', 500, 320, '2009-09-11'),
('0003', '运动T恤', '衣服', 4000, 2800, NULL),
('0004', '菜刀', '厨房用具', 3000, 2800, '2009-09-20');
-- 将商品表中的数据复制到商品复制表中
INSERT INTO productcopy (product_id, product_name, product_type, sale_price, purchase_price, regist_date)
SELECT product_id, product_name, product_type, sale_price, purchase_price, regist_date
FROM Product;
2.9 索引
CREATE TABLE mytable(
ID INT NOT NULL,
username VARCHAR(16) NOT NULL,
INDEX [indexName] (username(length))
);
-- 方法1
CREATE INDEX indexName ON table_name (column_name)
-- 方法2
ALTER table tableName ADD INDEX indexName(columnName)
索引分类:
- 主键索引:建立在主键上的索引被称为主键索引,一张数据表只能有一个主键索引,索引列值不允许有空值,通常在创建表时一起创建。
- 唯一索引:建立在UNIQUE字段上的索引被称为唯一索引,一张表可以有多个唯一索引,索引列值允许为空,列值中出现多个空值不会发生重复冲突。
- 普通索引:建立在普通字段上的索引被称为普通索引。
- 前缀索引:前缀索引是指对字符类型字段的前几个字符或对二进制类型字段的前几个bytes建立的索引,而不是在整个字段上建索引。前缀索引可以建立在类型为char、varchar、binary、varbinary的列上,可以大大减少索引占用的存储空间,也能提升索引的查询效率。
- 全文索引:利用“分词技术”实现在长文本中搜索关键字的一种索引。
- 单列索引:建立在单个列上的索引被称为单列索引。
- 联合索引(复合索引、多列索引):建立在多个列上的索引被称为联合索引,又叫复合索引、组合索引。
作业
CREATE TABLE Addressbook
(regist_no INTEGER NOT NULL,
name VARCHAR(128) NOT NULL,
address VARCHAR(256) NOT NULL,
tel_no CHAR(10),
mail_address CHAR(20),
PRIMARY KEY (regist_no));