mysql 两个字段去重_【数据仓库04回】MySQL补充

最新推荐文章于 2022-04-23 17:09:55 发布

weixin_39809168

最新推荐文章于 2022-04-23 17:09:55 发布

阅读量417

点赞数

文章标签： mysql 两个字段去重

1. 前文

老冯：【大数据03回】SQL语句入门zhuanlan.zhihu.com

2. MySQL安装部署

https://blog.csdn.net/csdn_mycsdn/article/details/103363310blog.csdn.net

3. MySQL的字段类型

数值类型

int 整数型   
long 长整形   
float 单精度   
double 双精度   
decimal 小数型 金额

字符串类型

char   字节 定长 范围0-255字节 如果长度不够会自动补全
varhar 字符串 变长 范围0-65535字节

日期类型

date 日期 YYYY-MM-DD
time HH:MM:SS
datetime 年月日时分秒 YYYY-MM-DD HH:MM:SS
timestamp 年月日时分秒 YYYY-MM-DD HH:MM:SS

4. 建表规划

create

表名称字段名统一不能是中文，也不能是汉语拼音
统一风格，已存在的表是什么风格，就要遵循；如果是新建的表，风格定义要统一标准
第一个字段必须id 是自增长，是主键且无意义
一张表只有一个主键 primary key==》id 非空 unique+not null，业务字段如果是非空，需要unique约束

ALTER TABLE bigdata.testdata ADD CONSTRAINT testdata_un UNIQUE KEY (name) ;

后四个字段必须要加上：用户创建时间修改用户修改时间
业务字段上加上注释 COMMENT

CREATE TABLE `testdata` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(200) DEFAULT NULL COMMENT '用户名称',
`age` int(3) DEFAULT NULL COMMENT '用户年龄',
`createuser` varchar(200) DEFAULT NULL,
`createtime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
`updateuser` varchar(200) DEFAULT NULL,
`updatetime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
PRIMARY KEY (`id`),
UNIQUE KEY `rzdata_un` (`name`)
  ) ENGINE=InnoDB DEFAULT CHARSET=utf8; --表示字符集

5. 字符集

字符集包括多种

database 字符集
table 字符集 
column 字符集
服务端 字符集
客户端 字符集

查看创建表的字符集

mysql> show create database bigdata
  	-> ;
  +----------+--------------------------------------------------------------------+
  | Database | Create Database                                                    |
  +----------+--------------------------------------------------------------------+
  | bigdata  | CREATE DATABASE `bigdata` /*!40100 DEFAULT CHARACTER SET latin1 */ |
  +----------+--------------------------------------------------------------------+
  1 row in set (0.00 sec)

查看字符集（下面的字符集是生成的配置）

mysql> show variables like '%char%'
  -> ;
  +--------------------------+---------------------------------------------------------------+
  | Variable_name            | Value                                                         |
  +--------------------------+---------------------------------------------------------------+
  | character_set_client     | utf8   #客户端字符集                                                       |
  | character_set_connection | utf8                                                          |
  | character_set_database   | latin1  #database 字符集                                                    |
  | character_set_filesystem | binary                                                        |
  | character_set_results    | utf8                                                          |
  | character_set_server     | latin1  #服务端字符集                                                     |
  | character_set_system     | utf8                                                          |
  | character_sets_dir       | /usr/local/mysql-5.6.23-linux-glibc2.5-x86_64/share/charsets/ |
  +--------------------------+---------------------------------------------------------------+
  8 rows in set (0.00 sec)

8. 多表查询

左连接 left join
  以左边的表为主表，查询的时候，左边的表会全部查询出来；右边的表是匹配的，匹配到就显示，匹配不到就null
  
右连接 right join
  以右边的表为主表，查询的时候，右边的表会全部查询出来；左边的表是匹配的，匹配到就显示，匹配不到就为null
  
内连接 inner join
  两张表都存在的显示，不存在的不显示

关联时出现笛卡尔积的一种特殊情况:比如做关联查询 a.aid = b.bid,如果aid有1w个null值，bid有10w个null值，那会产生笛卡尔积 1w * 10w个数据。所以关联的时候一定要注意这种情况，排除null值。

7. 小知识点

1）datetime timestamp区别

两者的存储方式不一样

`对于TIMESTAMP：
它把客户端插入的时间从 当前时区 转化为UTC（世界标准时间）进行存储。
查询时，将其又转化为客户端当前时区进行返回。

`对于DATETIME：
不做任何改变，基本上是原样输入和输出。

两者所能存储的时间范围不一样

timestamp存储的时间范围：'1970-01-01 00:00:01.000000' 到 '2038-01-19 03:14:07.999999'。

datetime存储的时间范围：'1000-01-01 00:00:00.000000' 到 '9999-12-31 23:59:59.999999'。

除了存储范围和存储方式不一样，没有大区别。对于跨时区的业务，TIMESTAMP更为合适。

2）mysql执行sql的顺序

开始->FROM子句->WHERE子句->GROUP BY子句->HAVING子句->ORDER BY子句->SELECT子句->LIMIT子句->最终结果

3）count()函数

使用count(id)替换count(*)的使用，可以提升性能
sum()计算统计字段的和，count()统计字段的数量

4）聚合函数中的null值

如果在进行数值计算的时候，字段中存在null值，则计算的结果是null值，
在进行数值运算的时候使用IFNULL(expression, alt_value)替换null值为备用值，则能计算出结果：第一个参数的表达式 expression 为 NULL，则返回第二个参数的备用值。

5）unoin和union all的区别

union的用法是把联合查询中的语句如果整体重复则去重，unoin all不会去重

weixin_39809168

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫