mysql 两个字段去重_【数据仓库04回】MySQL补充

1. 前文

老冯:【大数据03回】SQL语句入门​zhuanlan.zhihu.com

2. MySQL安装部署

https://blog.csdn.net/csdn_mycsdn/article/details/103363310​blog.csdn.net

3. MySQL的字段类型

数值类型

int 整数型   
long 长整形   
float 单精度   
double 双精度   
decimal 小数型 金额

字符串类型

char   字节 定长 范围0-255字节 如果长度不够会自动补全
varhar 字符串 变长 范围0-65535字节

日期类型

date 日期 YYYY-MM-DD
time HH:MM:SS
datetime 年月日时分秒 YYYY-MM-DD HH:MM:SS
timestamp 年月日时分秒 YYYY-MM-DD HH:MM:SS

4. 建表规划

create 
  • 表名称 字段名统一不能是中文,也不能是汉语拼音
  • 统一风格,已存在的表是什么风格,就要遵循;如果是新建的表,风格定义要统一标准
  • 第一个字段必须id 是自增长,是主键且无意义
  • 一张表只有一个主键 primary key==》id 非空 unique+not null,业务字段如果是非空,需要unique约束
ALTER TABLE bigdata.testdata ADD CONSTRAINT testdata_un UNIQUE KEY (name) ;
  • 后四个字段必须要加上:用户 创建时间 修改用户 修改时间
  • 业务字段上加上注释 COMMENT
CREATE TABLE `testdata` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(200) DEFAULT NULL COMMENT '用户名称',
`age` int(3) DEFAULT NULL COMMENT '用户年龄',
`createuser` varchar(200) DEFAULT NULL,
`createtime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
`updateuser` varchar(200) DEFAULT NULL,
`updatetime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
PRIMARY KEY (`id`),
UNIQUE KEY `rzdata_un` (`name`)
  ) ENGINE=InnoDB DEFAULT CHARSET=utf8; --表示字符集

5. 字符集

字符集包括多种

database 字符集
table 字符集 
column 字符集
服务端 字符集
客户端 字符集

查看创建表的字符集

mysql> show create database bigdata
  	-> ;
  +----------+--------------------------------------------------------------------+
  | Database | Create Database                                                    |
  +----------+--------------------------------------------------------------------+
  | bigdata  | CREATE DATABASE `bigdata` /*!40100 DEFAULT CHARACTER SET latin1 */ |
  +----------+--------------------------------------------------------------------+
  1 row in set (0.00 sec)

查看字符集(下面的字符集是生成的配置)

mysql> show variables like '%char%'
  -> ;
  +--------------------------+---------------------------------------------------------------+
  | Variable_name            | Value                                                         |
  +--------------------------+---------------------------------------------------------------+
  | character_set_client     | utf8   #客户端字符集                                                       |
  | character_set_connection | utf8                                                          |
  | character_set_database   | latin1  #database 字符集                                                    |
  | character_set_filesystem | binary                                                        |
  | character_set_results    | utf8                                                          |
  | character_set_server     | latin1  #服务端字符集                                                     |
  | character_set_system     | utf8                                                          |
  | character_sets_dir       | /usr/local/mysql-5.6.23-linux-glibc2.5-x86_64/share/charsets/ |
  +--------------------------+---------------------------------------------------------------+
  8 rows in set (0.00 sec)

8. 多表查询

左连接 left join
  以左边的表为主表,查询的时候,左边的表会全部查询出来;右边的表是匹配的,匹配到就显示,匹配不到就null
  
右连接 right join
  以右边的表为主表,查询的时候,右边的表会全部查询出来;左边的表是匹配的,匹配到就显示,匹配不到就为null
  
内连接 inner join
  两张表都存在的显示,不存在的不显示

关联时出现笛卡尔积的一种特殊情况:比如做关联查询 a.aid = b.bid,如果aid有1w个null值,bid有10w个null值,那会产生笛卡尔积 1w * 10w个数据。所以关联的时候一定要注意这种情况,排除null值。

7. 小知识点

1)datetime timestamp区别

两者的存储方式不一样

`对于TIMESTAMP:
它把客户端插入的时间从 当前时区 转化为UTC(世界标准时间)进行存储。
查询时,将其又转化为客户端当前时区进行返回。

`对于DATETIME:
不做任何改变,基本上是原样输入和输出。

两者所能存储的时间范围不一样

timestamp存储的时间范围:'1970-01-01 00:00:01.000000' 到 '2038-01-19 03:14:07.999999'。

datetime存储的时间范围:'1000-01-01 00:00:00.000000' 到 '9999-12-31 23:59:59.999999'。

除了存储范围和存储方式不一样,没有大区别。对于跨时区的业务,TIMESTAMP更为合适。

2)mysql执行sql的顺序

开始->FROM子句->WHERE子句->GROUP BY子句->HAVING子句->ORDER BY子句->SELECT子句->LIMIT子句->最终结果

3)count()函数

使用count(id)替换count(*)的使用,可以提升性能
sum()计算统计字段的和,count()统计字段的数量

4)聚合函数中的null值

如果在进行数值计算的时候,字段中存在null值,则计算的结果是null值,
在进行数值运算的时候使用IFNULL(expression, alt_value)替换null值为备用值,则能计算出结果:第一个参数的表达式 expression 为 NULL,则返回第二个参数的备用值。

5)unoin和union all的区别

union的用法是把联合查询中的语句如果整体重复则去重,unoin all不会去重

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值