1.字符集
一般选择utf8.
下面介绍一下utf8与utfmb4的区别:
utf8mb4兼容utf8,且比utf8能表示更多的字符。
注:unicode编码区从1 ~ 126就属于传统utf8区,当然utf8mb4也兼容这个区,126行以下就是utf8mb4扩充区,什么时候你需要存储那些字符,你才用utf8mb4,否则只是浪费空间。
2.排序规则
2.1 说明
排序规则:是指对指定字符集下不同字符的比较规则。
其特征有以下几点:
(1)两个不同的字符集不能有相同的排序规则;
(2) 两个字符集有一个默认的排序规则;
(3) 有一些常用的命名规则。如_ci结尾表示大小写不敏感(caseinsensitive),_cs表示大小写敏感(case sensitive),_bin表示二进制的比较(binary)。
2.2 区别
- utf8_general_ci 不区分大小写。这个你在注册用户名和邮箱的时候就要使用。(注:大多数邮件系统都不区分大小写)
- utf8_general_cs 区分大小写。
- utf8_bin:字符串每个字符串用二进制数据编译存储。 区分大小写,而且可以存二进制的内容。
utf8_unicode_ci和utf8_general_ci对中、英文来说没有实质的差别。
- utf8_general_ci校对速度快,但准确度稍差。(准确度够用,一般建库选择这个)
- utf8_unicode_ci准确度高,但校对速度稍慢。