utf8mb4的来历
MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode。(gbk是双字节的,utf8是三字节的,utf8mb4是四字节的)
举个栗子:
最常见的就是Emoji 表情(Emoji 是一种特殊的 Unicode 编码,常见于 ios 和 android 手机上),和一些不常用的汉字,以及任何新增的 Unicode 字符等
将utf8升级到utf8mb4
utf8mb4是utf8的超集,除了将编码改为utf8mb4外,不需要做其他转换。当然,为了节省空间,一般情况下使用utf8也就够了。
如果数据表中需要存储Emoji表情,建议表的编码使用utf8mb4编码
如果实际用途上来看,可以给要用到emoji的库或者说表,设置utf8mb4.
比如评论要支持emoji可以用到。
建议普通表使用utf8 如果这个表需要支持emoji就使用utf8mb4
新建mysql库或者表的时候还有一个排序规则
utf8_unicode_ci比较准确,utf8_general_ci速度比较快。通常情况下 utf8_general_ci的准确性就够我们用的了,在我看过很多程序源码后,发现它们大多数也用的是utf8_general_ci,所以新建数据 库时一般选用utf8_general_ci就可以了
如果是utf8mb4那么对应的就是 utf8mb4_general_ci utf8mb4_unicode_ci