MySQL字符集问题

公司一个旧的项目需要支持 emoji 表情,一开始以为只要修改下数据库的表字段就好,没想到引发了一系列的问题。总结一下,以作备忘。

MySQL 字符集设置

  • 系统变量:

图1

character_set_server:默认的内部操作字符集
character_set_client:客户端来源数据使用的字符集
character_set_connection:连接层字符集
character_set_results: 查询结果字符集
character_set_database:当前选中数据库的默认字符集
character_set_system:系统元数据(字段名等)字符集

MySQL 中的字符集转换过程

  • MySQL Server收到请求时将请求数据从 character_set_client 转换为character_set_connection
  • 进行内部操作前将请求数据从 character_set_connection 转换为内部操作字符集,其确定方法如下:
  • 使用表中字段的 CHARACTER SET 设定值;
  • 若上述值不存在,则使用对应数据表的 DEFAULT CHARACTER SET 设定值(MySQL扩展,非SQL标准);
  • 若上述值不存在,则使用对应数据库的 DEFAULT CHARACTER SET 设定值;
  • 若上述值不存在,则使用 character_set_server 设定值。
  • 将操作结果从内部操作字符集转换为 character_set_results, 响应请求。

MySQL 启动配置文件 my.cnf

图2

default-character-set: 设置 mysql 命令行连接的默认字符集
character-set-server: 设置系统内部操作字符集(即上文说到的character_set_server)
collation_server: 设置系统默认字符集排序

PHP连接 MySQL(以PDO连接方式为例)

常见的两种设置字符集的方式

  • mysql:host=localhost;dbname=db_demo;charset=utf8mb4
  • PDO::MYSQL_ATTR_INIT_COMMAND => “SET NAMES utf8mb4”

总结

  • 数据表字段的字符集需要是utf8mb4,这个是刚需
  • 一般 character_set_clientcharacter_set_connectioncharacter_set_results 的字符集相同,且都为utf8mb4(这三个参数默认都是utf8mb4,如果不是,是实现不了 emoji 表情的,原因参照字符集转换过程)。
  • 连接数据库的字符集也需要是utf8mb4
  • character_set_servercharacter_set_database 等默认字符集的类型并没有那么重要,但最好还是保持一致
  • TP 的坑果然是多,远离TP

参考

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值