本笔记为阿里云天池龙珠计划SQL训练营的学习内容,链接为:https://tianchi.aliyun.com/specials/promotion/aicampsql;
由于本人在大学本科阶段自学的方式潦草而不系统,没有形成属于自己的结构化知识框架。因此,秉着温故而知新、查漏补缺的想法,决定开启sql->python->机器学习->深度学习为大致方向的学习计划。
面试时现场编码以及做题时一般以sqlite为主,日常工作中主要涉及的是Hive sql 和Mysql数据库。三者之间语法上存在区别,比如部分函数的可用性,但其语法上都有很强的通用性。本次SQL主要以Mysql为主。
目录
Task 1 SQL基础:初识数据库与SQL-安装与基本介绍等
Task 1 SQL基础:初识数据库与SQL-安装与基本介绍等
本地Mysql安装方法
篇章内使用MySQL版本为MySQL8.0.0。关于安装部分,可参考阿里云编写的文档:
http://tianchi-media.oss-cn-beijing.aliyuncs.com/dragonball/SQL/other/本地MySQL环境搭建方法介绍.pdf
知识点梳理
名词解释
数据库中存储的表结构类似于excel中的行和列,在数据库中,行称为记录,它相当于一条记录,列称为字段,它代表了表中存储的数据项目。
书写规则
- win 系统默认不区分表名及字段名的大小写
- linux / mac 默认严格区分表名及字段名的大小
因此,windows版本无需注重表名/字段,而转移系统后则需要规范操作。
基本语句
1.数据库的创建( CREATE DATABASE 语句)
-- 创建数据库模板 CREATE DATABASE < 数据库名称 > ;
-- 创建数据库<shop>
CREATE DATABASE shop ;
2.表的创建( CREATE TABLE 语句)
/* 创建表模板
CREATE TABLE < 表名 >
( < 列名 1> < 数据类型 > < 该列所需约束 > ,
< 列名 2> < 数据类型 > < 该列所需约束 > ,
< 列名 3> < 数据类型 > < 该列所需约束 > ,
< 列名 4> < 数据类型 > < 该列所需约束 > ,
.
.
.
< 该表的约束 1> , < 该表的约束 2> ,……);
*/
-- 创建商品表
CREATE TABLE product(
product_id CHAR(4) NOT NULL, -- 设立主键也可product_id CHAR(4) NOT NULL PRIMARY KEY
product_name VARCHAR(100) NOT NULL,
product_type VARCHAR(32) NOT NULL,
sale_price INTEGER,
purchase_price INTEGER,
regist_date DATE,
PRIMARY KEY(product_id)
) ;
创建表的语法中需要指定字段的数据类型及添加约束条件。
四种最基本的数据类型
- INTEGER 型
用来指定存储整数的列的数据类型(数字型),不能存储小数。
- CHAR 型
用来存储定长字符串,当列中存储的字符串长度达不到最大长度的时候,使用半角空格进行补足,由于会浪费存储空间,所以一般在字符确定长度情况下使用比如身份证等。
- VARCHAR 型
用来存储可变长度字符串,定长字符串在字符数未达到最大长度时会用半角空格补足,但可变长字符串不同,即使字符数未达到最大长度,也不会用半角空格补足。
- DATE 型
用来指定存储日期(年月日)的列的数据类型(日期型)。
约束是除了数据类型之外,对列中存储的数据进行限制或者追加条件的功能。
NOT NULL
是非空约束,即该列必须输入数据。
PRIMARY KEY
是主键约束,代表该列是唯一值,可以通过该列取出特定的行的数据。
3.表的删除
-- 删除表的语法: DROP TABLE < 表名 > ;
-- 删除<product>表
DROP TABLE product;
-- 添加列的ALTER TABLE语句: ALTER TABLE < 表名 > ADD COLUMN < 列的定义 >;
-- 添加一列可以存储100位的可变长字符串的 product_name_pinyin 列
ALTER TABLE product ADD COLUMN product_name_pinyin VARCHAR(100);
-- 删除列的 ALTER TABLE 语句: ALTER TABLE < 表名 > DROP COLUMN < 列名 >;
-- 删除 product_name_pinyin 列
ALTER TABLE product DROP COLUMN product_name_pinyin;
-- ALTER TABLE 语句和 DROP TABLE 语句一样,执行之后无法恢复。误添的列可以通过 ALTER TABLE 语句删除,或者将表全部删除之后重新再创建。
-- 清空表内容(仅删除表中数据,不常用)
TRUNCATE TABLE TABLE_NAME;
-- 优点:相比drop``/``delete,truncate用来清除数据时,速度最快。
4.表的更新
/* 数据更新基本语法
UPDATE <表名>
SET <列名> = <表达式> [, <列名2>=<表达式2>...];
WHERE <条件>; -- 可选,非常重要。
ORDER BY 子句; --可选
LIMIT 子句; --可选
*/
-- 使用 update 时要注意添加 where 条件,否则将会将所有的行按照语句修改
-- 修改所有的注册时间
UPDATE product
SET regist_date = '2009-10-10';
-- 仅修改部分商品的单价
UPDATE product
SET sale_price = sale_price * 10
WHERE product_type = '厨房用具';
-- 将商品编号为0008的数据(圆珠笔)的登记日期更新为NULL
UPDATE product
SET regist_date = NULL
WHERE product_id = '0008';
/*和 INSERT 语句一样, UPDATE 语句也可以将 NULL 作为一个值来使用。
但是,只有未设置 NOT NULL 约束和主键约束的列才可以清空为NULL。**如果将设置了上述约束的列更新为 NULL,就会出错,这点与INSERT 语句相同。*/
-- 多列更新 UPDATE 语句的 SET 子句支持同时将多个列作为更新对象。
-- 基础写法,一条UPDATE语句只更新一列
UPDATE product
SET sale_price = sale_price * 10
WHERE product_type = '厨房用具';
UPDATE product
SET purchase_price = purchase_price / 2
WHERE product_type = '厨房用具';
-- 合并后的写法
UPDATE product
SET sale_price = sale_price * 10,
purchase_price = purchase_price / 2
WHERE product_type = '厨房用具';
5.插入数据
-- 首先创建一个productions表
CREATE TABLE productins
(product_id CHAR(4) NOT NULL,
product_name VARCHAR(100) NOT NULL,
product_type VARCHAR(32) NOT NULL,
sale_price INTEGER DEFAULT 0, --该字段开始初始值(默认值)均设为0
purchase_price INTEGER ,
regist_date DATE ,
PRIMARY KEY (product_id));
-- 插入基本语法: INSERT INTO <表名> (列1, 列2, 列3, ……) VALUES (值1, 值2, 值3, ……);
-- 对表进行全列 INSERT 时,可以省略表名后的列清单。这时 VALUES子句的值会默认按照从左到右的顺序赋给每一列。
-- 包含列清单
INSERT INTO productins (product_id, product_name, product_type,
sale_price, purchase_price, regist_date) VALUES ('0005', '高压锅', '厨房用具', 6800, 5000, '2009-01-15');
-- 省略列清单(常用)
INSERT INTO productins
VALUES ('0005', '高压锅', '厨房用具', 6800, 5000, '2009-01-15');
-- 一般都是按顺序添加的,否则该条数据会缺失某字段的数据。
-- 通常的INSERT
INSERT INTO productins VALUES ('0002', '打孔器',
'办公用品', 500, 320, '2009-09-11');
INSERT INTO productins VALUES ('0003', '运动T恤',
'衣服', 4000, 2800, NULL);
INSERT INTO productins VALUES ('0004', '菜刀',
'厨房用具', 3000, 2800, '2009-09-20');
-- 多行INSERT ( DB2、SQL、SQL Server、 PostgreSQL 和 MySQL多行插入)
INSERT INTO productins VALUES ('0002', '打孔器',
'办公用品', 500, 320, '2009-09-11'),
('0003', '运动T恤', '衣服', 4000, 2800, NULL), -- INSERT 语句中想给某一列赋予 NULL 值时,可以直接在 VALUES子句的值清单中写入 NULL。想要插入 NULL 的列一定不能设置 NOT NULL 约束。
('0004', '菜刀', '厨房用具', 3000, 2800, '2009-09-20');
-- 可以使用INSERT … SELECT 语句从其他表复制数据。
-- 将商品表中的数据复制到商品复制表中
INSERT INTO productocpy (product_id, product_name, product_type, sale_price, purchase_price, regist_date)
SELECT product_id, product_name, product_type, sale_price,
purchase_price, regist_date
FROM Product;
练习题
建议使用Mysql workbench、Navicat等交互性较强的SQL编辑器,边看题边在旁作练习。
1. 编写一条 CREATE TABLE 语句,用来创建一个包含表 1-A 中所列各项的表 Addressbook (地址簿),并为 regist_no (注册编号)列设置主键约束
表1-A 表 Addressbook (地址簿)中的列
create table Addressbook(
regist_no int not null,
name varchar(128) not null,
address varchar(256) not null,
tel_no char(10),
mail_address char(20),
primary key (regist_no));
2. 假设在创建练习1.1中的 Addressbook 表时忘记添加如下一列 postal_code (邮政编码)了,请把此列添加到 Addressbook 表中。
列名 : postal_code
数据类型 :定长字符串类型(长度为 8)
约束 :不能为 NULL
alter table addressbook add column postal_code char(8) not null;
3. 编写 SQL 语句来删除 Addressbook 表。
drop table Addressbook;
4. 编写 SQL 语句来恢复删除掉的 Addressbook 表。
-- 误删了只能重新建立,所以杜绝删表跑路
create table Addressbook(
regist_no int not null,
name varchar(128) not null,
address varchar(256) not null,
tel_no char(10),
mail_address char(20),
primary key (regist_no));
总结
1.学习create/drop
2.alter 对列操作 (add column;drop column)
新增列:ALTER TABLE < 表名 > ADD COLUMN < 列的定义 >;
删除列: ALTER TABLE < 表名 > DROP COLUMN < 列名 >;
3.insert 对行操作 可以对接select 。
INSERT INTO <表名> (列1, 列2, 列3, ……) VALUES (值1, 值2, 值3, ……);
4.update 文中没显示可以对接select 但实际也很有用,先暂且不表。
UPDATE <表名>
SET <列名> = <表达式> [, <列名2>=<表达式2>...];
WHERE <条件>; -- 可选,非常重要。
ORDER BY 子句; --可选
LIMIT 子句; --可选