MySQL数据类型
1. 数据类型分类
2. 数值类型
2.1 tinyint类型
根据上表可知tinyint的数据范围为-128~127,而tinyint unsigned的数据范围为0~255。
创建两张表,数据类型分别为tinyint和tinyint unsigned。
可以发现:
- 整型可以指定是有符号的和无符号的,默认是有符号的。
- 可以通过UNSIGNED来说明某个字段是无符号的。
- 插入不合法数据时,MySQL会直接拦截报错。
一般而言,在MySQL中,数据类型本身也是一种约束。(约束使用者进行正确的插入,就能保证数据库中的数据是可预期的,完整的)
2.2 bit类型
基本语法:
bit[(M)] : 位字段类型。M表示每个值的位数,范围从1到64。如果M被忽略,默认为1。
示例:
我们发现online的类型是一个bit位,但是查看数据时却没有显示到显示器上,这是因为bit字段在显示时,是按照ASCII码对应的值显示。
接下来我们验证一下是否为ASCII码值显示,使用表操作指令修改online的属性为10个bit位,插入字符‘A’的ASCII码值,打印
3. 小数类型
3.1 float类型
语法:
float[(m, d)] [unsigned] : M指定显示长度,d指定小数位数,占用空间4个字节
示例:
float(4,2)表示的范围是-99.99 ~ 99.99,MySQL在保存值时会进行四舍五入。
如果定义的是float(4,2) unsigned 这时,因为把它指定为无符号的数,范围是 0 ~ 99.99。
3.2 decimal类型
语法:
decimal(m, d) [unsigned] : 定点数m指定长度,d表示小数点的位数
- decimal(5,2) 表示的范围是 -999.99 ~ 999.99
- decimal(5,2) unsigned 表示的范围 0 ~ 999.99
- decimal和float很像,但是有区别:float和decimal表示的精度不一样
说明:float表示的精度大约是7位。
- decimal整数最大位数m为65。支持小数最大位数d是30。如果d被省略,默认为0。如果m被省略,默认是10。
- 如果希望小数的精度高,推荐使用decimal。
4. 字符串类型
4.1 char类型
语法:
char(L): 固定长度字符串,L是可以存储的长度,单位为字符,最大长度值可以为255
示例:
char(2) 表示可以存放两个字符,可以是字母或汉字,但是不能超过2个
4.2 varchar类型
语法:
varchar(L): 可变长度字符串,L表示字符长度,最大长度65535个字节
示例:
我们更改一下varchar的属性,将它的大小改为65535依旧会报错,这是为什么呢?
关于varchar(len),len到底是多大,这个len值,和表的编码密切相关:
- varchar长度可以指定为0到65535之间的值,但是有1 - 3 个字节用于记录数据大小,所以说有效字节数是65532。
- 当我们的表的编码是utf8时,varchar(n)的参数n最大值是
65532/3=21844
(因为utf8中,一个字符占用3个字节)。 - 如果编码是gbk,varchar(n)的参数n最大是
65532/2=32766
(因为gbk中,一个字符占用2字节)。
4.3 char和varchar比较
从上面的示例可以看出,varchar(4)也只能输入4个字符,那他和char(4)有什么区别呢?
简单来说:
- char是定长字符串,直接开辟好对应的空间。
- varchar是变长字符串,在不超过自定义范围的情况下,用多少开多少。
如何选择定长或变长字符串?
- 如果数据确定长度都一样,就使用定长(char),比如:身份证,手机号,md5
- 如果数据长度有变化,就使用变长(varchar), 比如:名字,地址,但是你要保证最长的能存的进去。
- 定长的磁盘空间比较浪费,但是效率高。
- 变长的磁盘空间比较节省,但是效率低。
5. 日期和时间类型
常用的日期有如下三个:
- date :日期
'yyyy-mm-dd'
,占用三字节。 - datetime: 时间
'yyyy-mm-dd HH:ii:ss'
表示范围从1000 到9999 ,占用八字节。 - timestamp:时间戳,从1970年开始的
'yyyy-mm-dd HH:ii:ss'
格式和 datetime 完全一致,占用四字节。
示例:
不自定义的插入或更新时间戳时,时间戳会自动更新时间。
6. enum和set类型
enum:枚举,“单选”类型;该设定只是提供了若干个选项的值,最终一个单元格中,实际只存储了其中一个值;
语法:
enum('选项1','选项2','选项3',...);
set:集合,“多选”类型;该设定只是提供了若干个选项的值,最终一个单元格中,设计可存储了其中任意多个值;
set('选项值1','选项值2','选项值3', ...);
说明:
示例:
有一个调查表votes,性别(男,女)[单选],需要调查人的喜好, 比如(登山,游泳,篮球,武术)中去选择[可以多选]
注意:
-
出于效率考虑,enum和set中每个选项的值实际存储的是“数字”。
-
使用数字标识enum的时候,就是正常的数组下标
-
使用数字标识set的时候,采用比特位位置来和set中的每个对应起来
例如上述示例中的爱好,
hobby set('登山','游泳','篮球','武术')
,一共4个比特位,从前往后每个选项对应的比特位由低到高。 -
不建议在添加枚举值,集合值的时候采用数字的方式,因为不利于阅读。
想查找所有喜欢登山的人,使用如下查询语句:
select * from votes where hobby='登山';
但是不能查询出所有爱好为登山的人,集合查询使用find_ in_ set
函数:
# find_in_set(sub,str_list) :如果sub 在str_list 中,则返回下标;如果不在,返回0;
# str_list 用逗号分隔的字符串。
select * from votes where find_in_set('登山', hobby);