MySQL数据类型及优化

最新推荐文章于 2022-03-30 01:43:44 发布

GattacaYang

最新推荐文章于 2022-03-30 01:43:44 发布

阅读量529

点赞数

分类专栏： Mysql

本文链接：https://blog.csdn.net/YL_max/article/details/82055430

版权

Mysql 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

一、数据类型

1、整数类型

存储类型：

TINTINT,SMALLINT,MEDIUMINT,INT,BIGINT,分别使用8,16,24,32,64 位存储空间。表示范围大小从-2^(N-1)到2^(N-1)-1,N为存储空间的位数。
UNSIGNED可使数据为正数，正数范围翻倍，即0到2^(N)-1。TINTINT(-128-127) TINTINT UNSIGNED(0-255)
INT(10),INT(1)设置的只是正数类型显示时的数据宽度，对于存储和计算来说，两个并无区别。

计算类型：

一般使用64位的BIGINT正数作为计算类型。一些聚合函数可能会使用DECIMAL或者DOUBLE进行计算。

2、实数类型

存储类型：

DECIMAL: 可以指定小数点前后所允许的最大位数。DECIMAL(18,9)指定小数点两边各存储9个数字，一共使用9个字节，小数点前后的9个数字各使用4个字节，小数点占一个字节。
FLOAT:4个字节
DOUBLE:8个字节

计算类型：

DOUBLE类型

3、字符串类型

VARCHAR

定义：可变长字符串，仅使用必要的空间。

特点：

1、VARCHAR需要使用1或2个额外的字节记录字符串的长度：如果列最大长度小于等于255个字节则使用1个字节表示，否则使用2个字节。如varchar(10)实际需要11个字节存储空间，varchar(1000)实际需要1002字节的存储空间。
2、MYSQL存储和检索时会保留末尾空格。

适用场景:

1、字符串的最大长度比平均长度大很多。
2、列的更新很少，不易产生碎片。
3、UTF-8这种复杂字符集，每个字符都使用不同的字节数进行存储。

CHAR

定义：定长字符串。

特点：

1、每个值占用的长度一定，即使实际并没有那么多。
2、MYSQL存储和检索时会剔除末尾空格。

适用场景：

1、存储很短的字符串，或者所有值接近同一个长度。如md5,uuid。
2、经常变更但长度相近的字符串，不容易产生碎片。
3、非常短的列，如性别M/F,char(1)优于varchar(1)，因为varchar(1)实际还需要一个字节来保存长度，空间占用上char更占优。

4、BLOB和TEXT

#定义：存储很大的二进制数据或者字符串。

#格式：

TINYBLOB-LONGBLOB
TINYTEXT-LONGTEXT

特点：

1、BLOB存储二进制数据，所以没有排序规则和字符集。TEXT有排序规则和字符集。
2、MYSQL对TEXT类型每个列的最前max_sort_length字节做排序而不是整个字符串做排序（太大），所以通过修改max_sort_length或者order by SUBSTRING(column,length)排序.
3、不可使用BOLB和TEXT列全部长度的字符串作为索引。若需要，则可以通过保存前几个长度字符作为新列来建索引。

5、日期和时间类型

DATETIME

特点

1、可保存大范围的值，从1001年到9999年，精度为秒。
2、日期和时间封装为YYYYMMDDHHMMSS格式的整数中，与时区无关，使用8个字节的存储空间。
3、以一种可排序的，无歧义的格式显示时间，如“2018-01-01 22:45:23”

TIMESTAMP

特点

1、保存了格林尼治标准时间（19700101）以来的秒数，和UNIX时间戳一致。
2、使用4个字节的存储空间，只能表示1970到2038年。
3、MYSQL显示TIMESTAMP时一般会根据时区转换成标准时间格式。
4、插入时如果未指定第一个TIMESTAMP列的值，MYSQL则会设置这个值为当前时间。
5、TIMESTAMP列默认为NOT NULL

6、ENUM和SET

定义

ENUM 枚举类型，SET集合类型

特点

1、MYSQL内部使用正数存储ENUM和SET类型，做比较时转换为字符串。
2、适用于做有序的状态，产品类型，性别等。

二、优化

1、如何选择合适的标识符列？

参考原则

1、整数通常是最好的标识符列，比较快，且可以使用自增长。
2、避免使用ENUM和SET。
3、如果可能也要避免字符串类型作为标识符。不仅消耗空间，而且比较也比整数慢。特别是在MYISAM中，因为其默认对字符串使用压缩存储，导致查询慢很多。
4、对于随机的字符串如MD5,SHA1,UUID也要特别注意，这些随机产生的值可能分布在很大的空间之内，导致select或update很慢。