1.Mysql 字符集
Mysql 的字符集支持涉及两个方面:字符集(character set)和排序方式(Collection)
对字符集的支持可以细化到四个层次:服务器(server)、数据库(database)、数据表(table)、连接(connection)。
连接Mysql 可通过如下命令查看字符集的详情:
show variables like 'character_set%';
show variables like '%collection_%';
2.命名规则
对数据库的命名必须遵循如下规则:
(1)为字母、数字、下划线的组合,尽量避免使用数字。
(2)不得使用关键字
(3)字母遵循英文简称或简写模式
(4)名称尽量与业务或企业文化相关
对表名称的命名必须遵循易懂,简单,无二义性原则。
(1)为字母或字母与数字的组合,总字符数不得超过64个
(2)禁止使用关键字
(3)分区表允许使用下划线
(4)表明遵循驼峰或下划线命名规则
(5)表名应与业务关联
对字段的命名必须遵循易懂,简单的原则
(1)为字母或字母与数字的组合,总字符数不得超过64个
(2)禁止使用关键字
(3)字母遵循英文简称、简写方式
(4)表明遵循驼峰或下划线命名规则
(5)下划线方式
(6)引用字段必须采用“被引用表名”+“被引用字段”的格式。
3.字段类型的选择
字段类型的选择遵循能占用一个字节绝不占用两个字节的原则,因此在设计表结构时需要预估字段值的范围
1)数字类型
(1)整数
- TINYINT:1字节
- SMALLINT:2字节
- MEDIUMINT:3字节
- INT或INTEGER:4字节
- BIGINT:8字节
对于自增字段,如果记录经常用做物理删除或记录数可能会超过21亿个,则必须用BIGINT,默认使用UNSIGNED类型。
标识状态、类型、种类时一律用TINYINT .依据域范围合理选择SMALLINT、MEDIUMINT。
(2)小数
FLOAT:4字节单精度浮点数值
DOUBLE:8字节双精度浮点数值
2)字符串类型
(1)CHAR(N)
占N个字节,1<=N<=255,适用于值的范围较为固定时,例如ip、url、phonenum等
(2)VARCHAR(M)
VARCHAR(M) 占L个字节,1<=L<=65535 ,其中最大能存储N个字符,1<=N<=21845
如果字符串列的最大长度比平均长度大很多且更新不频繁,则建议使用VARCHAR(M)
CHAR(1) 与 VARCHAR(1) 的区别为:虽然它们都只能用来保存单个字符,但是VARCHAR 要比 CHAR 多占用一个存储位置,这主要是因为在使用VARCHAR 数据类型时,会多用一个字节来存储长度信息
3)ENUM
ENUM 占1、2个字节,具体取决于枚举值的数量,最大为65535。
ENUM适合取值较少,且不经常变更的字段,例如sex,state,type等。
4) TEXT 和 BLOB 类型
TEXT 和 BLOB 类型都是为存储较大的数据而设计的字符串类型,分别采用字符和二进制的方式存储。下面主要介绍几种不同的类型。
(1)TINYBLOB、TINYTEXT:允许最大存储255个字符。
(2)BLOB 、TEXT:能存储64000个字节
(3)MEDIUMBLOB、MEDIUMTEXT:限制在16MB内
(4)LONGBLOB、LONGTEXT:存储容量可超过4GB
需要注意BLOB 类型存储的是二进制数据,没有排序规则和字符集,而TEXT 类型有字符集和排序规则。
5)DATETIME 和 TIMESTAMP
DATETIME 占8个字节,范围1001-9999年(和时区无关)
TIMESTAMP 占4个字节,范围为1970年1月1日 - 2028年(和时区有关)。如果在多个时区存储或访问数据,则会出现不同结果。
4.尽量遵循三范式
(1)第一范式:属性原子化,一个栏位不要包含多个属性
(2)第二范式:主键依赖,可以根据主键的唯一性确定其他属性
(3)第三范式:属性不依赖于其他非主属性