Mysql数据类型(数据结构,内存分配)主要分为三类
1.数值类型
2.字符类型
3.日期类型
(为了内存分配更合理,节省空间)
深度认知
1. 有些人不理解 int(10) 和int(5)这种指定长度有什么作用 [可以结合zerofill来讲解]
其实他们在存储的是时候都是分配了4个字节的长度,所占的内存一模一样!如果你存储的数值的长度比指定的长度小,那么少的部分用空格来填充,用zerofill可以看出效果。
如果比指定的大,那么mysql会自动去申请更多的空间,存储这个值。也就是这个宽度指示器不会影响字段能够存储的最大值。
2. char(5) 和varchar(5)
char本身是定长,而varchar是变长。在这里,如果你存储的值小于5,使用的是char(5),那么多出的空间用空格填充。如果用的是varchar(5),那么多余的空间被
mysql清理回收。而且这里的指示宽度 5表示 这个字段能够存储的最大字符数,而不是字节数。
3. char(n)和varchar(n)中括号中n代表字符的个数,并不代表字节个数,所以当使用了中文的时候(UTF8)意味着可以插入m个中文,但是实际会占用m*3个字节。
同时char和varchar最大的区别就在于char不管实际value都会占用n个字符的空间,而varchar只会占用实际字符应该占用的空间+1,并且实际空间+1<=n。
超过char和varchar的n设置后,字符串会被截断。
char的上限为255字节,varchar的上限65535字节,text的上限为65535。
char在存储的时候会截断尾部的空格,varchar和text不会。
varchar会使用1-3个字节来存储长度,text不会。
注意:使用VARCAHR(5)和VARCHAR(200)存储“hello”的空间开销都是一样的,那么使用更短的列有什么优势呢?(事实证明有很大的优势)
更长的列会消耗更多的内存,因为Mysql通常会分配固定大小的内存块来保存内部值。尤其是使用内存临时表进行排序或者操作时会特别糟糕。
在利用磁盘临时表进行排序时也同样糟糕。
(对于varchar来说,由于mysql要回收更多的内存,当数据量很大时,查询速度比char慢,*一般不固定长度用varchar。固定长度()身份证号码18位*)
4.除了特殊行为之外,通常也应该尽可能使用TIMESTAMP,因为它比DATETIME空间效率更高。
可以使用枚举(ENUM)代替字符串类型。很多时候建议使用枚举列代替常用的字符串类型。
使用数据类型的原则:
1,更小的通常更好,应该尽量使用可以正确存储数据的最小数据类型。
因为更小的数据类型通常更快,因为它们占用更少的磁盘、内存和CPU缓存,并且处理时需要的CPU周期也更短。
要确保没有低估需要存储的值的范围,更小是相对与数据类型的最大值范围来讲的。
如果无法确定哪个数据类型是最好的,就选择你认为不会超过范围的最小类型。
2,简单就好,简单数据类型的操作通常需要更少的CPU周期。
整型比字符串操作代价更低,因为字符串集和校对规则(排序规则)是的字符比较比整型比较更复杂。
存储日期和时间应该使用Mysql内建的类型(date,time,datatime)。
IP地址的存储应该用整型(int)。
3,尽量避免NULL,如果查询中包含可为NULL的列,对MySQL来说更难优化,因为可为NULL的列使得索引、索引统计和值比较都更复杂。
很多表都包含可为NULL的列,就算程序并不需要保存NULL也是如此,这是因为列的默认属性就是可为NULL。通常情况下最好指定列NOT NULL,除非真的需要存储NULL。
如果查询中包含可为NULL的列,对于Mysql来说是很难优化的,因为NULL的列使得索引,索引统计和值比较都更复杂。可为NULL的列会使用更多的存储空间,在Mysql里也需要特殊处理。
当可为NULL的列被索引时,每个索引记录需要一个额外的字节,在MyISAM里甚至还可能导致固定大小的索引变成可变大小的索引。
通常把可为NULL的列改为NOTNULL带来性能提升比较小,如果计划在列上建索引的话,就应该尽量避免设计成可为NULL的列。(也有一个例外,那就是在InnoDB中,会使用单独的位(bit)
来存储NULL值,所以对稀疏数据有很好的空间效率。)