Schema与数据类型优化
4.1 选择优化的数据类型
-
更小的通常更好
更小的数据类型通常更快,因为它们占用更少的磁盘,内存和CPU缓存,并且处理时需要的CPU周期也更少。
-
简单就好
简单数据类型的操作通常需要更少的CPU周期。
-
尽量避免NULL
如果查询中包含可为NULL的列,对MySQ来说更难优化,因为可为NULL的列使得索引,索引统计和值比较都更复杂。可为NULL的列会使用更多的存储空间,在MySQL里需要特殊处理。InnoDB使用单独的位存储NULL值,所以对于稀疏数据有很好的空间效率,但这一点不适用于MyISAM。
4.1.1 整数类型
两种类型的数字:整数和实数。
存储整数可使用的整数类型:TINYINT(8),SMALLINT(16),MEDIUMINT(24),INT(32),BIGINT(64)。他们可以存储的值的范围为-2^(N-1) 到 2 ^(N-1) -1,其中N是存储空间的位数。
整数类型有可选的UNSINGED属性,表示不允许负值。
4.1.2 实数类型
实数是带有小数部分的数字。但是,它们不只是为了存储小数部分,也可以使用DECIMAL存储比BIGINT还大的整数。MySQL既支持精确类型,也支持不精确类型。
FLOAT和DOUBLE类型支持使用标准的浮点运算进行近似计算。
DECIMAL类型用于存储精确的小数。
4.1.3 字符串类型
- VARCHAR和CHAR类型
VARCHAR和CHAR是两种主要的字符串类型。但是很难精确地解释这些值是怎么存储在磁盘和内存中的,因为这跟存储引擎的具体实现有关。下面的描述使用的存储引擎是InnoDB/MyISAM。
VARCHAR
VARCHAR类型用于存储可变长字符串,比定长类型更节省空间。有一种情况例外,如果MySQL表使用ROW_FORMAT=FIXED创建的话,每一行都会使用定长存储,这会很浪费空间。
VARCHAR需要使用1或2个额外字节记录字符串的长度:如果列的最大长度小于或等于255字节,则只使用1个字节表示,否则使用2个字节。
VARCHAR节省了存储空间,但是由于行是变长的,在UPDATE时可能使行变得比原来更长,这就导致需要做额外的工作。如果一个行占用的空间增长,并且在页内没有更多的空间可以存储,在这种情况下,不同的存储引擎的处理方