1. 前文
老冯:【大数据03回】SQL语句入门zhuanlan.zhihu.com2. MySQL安装部署
https://blog.csdn.net/csdn_mycsdn/article/details/103363310blog.csdn.net3. MySQL的字段类型
数值类型
int 整数型
long 长整形
float 单精度
double 双精度
decimal 小数型 金额
字符串类型
char 字节 定长 范围0-255字节 如果长度不够会自动补全
varhar 字符串 变长 范围0-65535字节
日期类型
date 日期 YYYY-MM-DD
time HH:MM:SS
datetime 年月日时分秒 YYYY-MM-DD HH:MM:SS
timestamp 年月日时分秒 YYYY-MM-DD HH:MM:SS
4. 建表规划
create
- 表名称 字段名统一不能是中文,也不能是汉语拼音
- 统一风格,已存在的表是什么风格,就要遵循;如果是新建的表,风格定义要统一标准
- 第一个字段必须id 是自增长,是主键且无意义
- 一张表只有一个主键 primary key==》id 非空 unique+not null,业务字段如果是非空,需要unique约束
ALTER TABLE bigdata.testdata ADD CONSTRAINT testdata_un UNIQUE KEY (name) ;
- 后四个字段必须要加上:用户 创建时间 修改用户 修改时间
- 业务字段上加上注释 COMMENT
CREATE TABLE `testdata` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(200) DEFAULT NULL COMMENT '用户名称',
`age` int(3) DEFAULT NULL COMMENT '用户年龄',
`createuser` varchar(200) DEFAULT NULL,
`createtime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
`updateuser` varchar(200) DEFAULT NULL,
`updatetime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
PRIMARY KEY (`id`),
UNIQUE KEY `rzdata_un` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8; --表示字符集
5. 字符集
字符集包括多种
database 字符集
table 字符集
column 字符集
服务端 字符集
客户端 字符集
查看创建表的字符集
mysql> show create database bigdata
-> ;
+----------+--------------------------------------------------------------------+
| Database | Create Database |
+----------+--------------------------------------------------------------------+
| bigdata | CREATE DATABASE `bigdata` /*!40100 DEFAULT CHARACTER SET latin1 */ |
+----------+--------------------------------------------------------------------+
1 row in set (0.00 sec)
查看字符集(下面的字符集是生成的配置)
mysql> show variables like '%char%'
-> ;
+--------------------------+---------------------------------------------------------------+
| Variable_name | Value |
+--------------------------+---------------------------------------------------------------+
| character_set_client | utf8 #客户端字符集 |
| character_set_connection | utf8 |
| character_set_database | latin1 #database 字符集 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | latin1 #服务端字符集 |
| character_set_system | utf8 |
| character_sets_dir | /usr/local/mysql-5.6.23-linux-glibc2.5-x86_64/share/charsets/ |
+--------------------------+---------------------------------------------------------------+
8 rows in set (0.00 sec)
8. 多表查询
左连接 left join
以左边的表为主表,查询的时候,左边的表会全部查询出来;右边的表是匹配的,匹配到就显示,匹配不到就null
右连接 right join
以右边的表为主表,查询的时候,右边的表会全部查询出来;左边的表是匹配的,匹配到就显示,匹配不到就为null
内连接 inner join
两张表都存在的显示,不存在的不显示
关联时出现笛卡尔积的一种特殊情况:比如做关联查询 a.aid = b.bid,如果aid有1w个null值,bid有10w个null值,那会产生笛卡尔积 1w * 10w个数据。所以关联的时候一定要注意这种情况,排除null值。
7. 小知识点
1)datetime timestamp区别
两者的存储方式不一样
`对于TIMESTAMP:
它把客户端插入的时间从 当前时区 转化为UTC(世界标准时间)进行存储。
查询时,将其又转化为客户端当前时区进行返回。
`对于DATETIME:
不做任何改变,基本上是原样输入和输出。
两者所能存储的时间范围不一样
timestamp存储的时间范围:'1970-01-01 00:00:01.000000' 到 '2038-01-19 03:14:07.999999'。
datetime存储的时间范围:'1000-01-01 00:00:00.000000' 到 '9999-12-31 23:59:59.999999'。
除了存储范围和存储方式不一样,没有大区别。对于跨时区的业务,TIMESTAMP更为合适。
2)mysql执行sql的顺序
开始->FROM子句->WHERE子句->GROUP BY子句->HAVING子句->ORDER BY子句->SELECT子句->LIMIT子句->最终结果
3)count()函数
使用count(id)替换count(*)的使用,可以提升性能
sum()计算统计字段的和,count()统计字段的数量
4)聚合函数中的null值
如果在进行数值计算的时候,字段中存在null值,则计算的结果是null值,
在进行数值运算的时候使用IFNULL(expression, alt_value)替换null值为备用值,则能计算出结果:第一个参数的表达式 expression 为 NULL,则返回第二个参数的备用值。
5)unoin和union all的区别
union的用法是把联合查询中的语句如果整体重复则去重,unoin all不会去重