MySQL设置真正的UTF-8

最新推荐文章于 2025-10-11 13:45:00 发布

原创最新推荐文章于 2025-10-11 13:45:00 发布 · 6.2k 阅读

16 ·

CC 4.0 BY-SA版权

本文揭示了MySQL和MariaDB中utf8编码的局限性，解释了其为何不能完全支持UTF-8标准，并提供了如何正确配置utf8mb4以确保全面兼容性的详细步骤。

以“utf8”编码的MariaDB中保存一个UTF-8字符串，然后出现了一个离奇的错误：

Incorrect string value: ‘ðŸ˜ƒ <…’ for column ‘summary’ at row 1

我用的是UTF-8编码的客户端，服务器也是UTF-8编码的，数据库也是，就连要保存的这个字符串“? <…”也是合法的UTF-8。

问题的症结在于，MySQL的“utf8”实际上不是真正的UTF-8。

“utf8”只支持每个字符最多三个字节，而真正的UTF-8是每个字符最多四个字节。

简单概括如下：

1.MySQL的“utf8mb4”是真正的“UTF-8”。
2.MySQL的“utf8”是一种“专属的编码”，它能够编码的Unicode字符并不多。
我要在这里澄清一下：所有在使用“utf8”的MySQL和MariaDB用户都应该改用“utf8mb4”，永远

修改默认编码
vi /etc/my.cnf

[client]
default-character-set = utf8mb4

[mysql]
default-character-set = utf8mb4

[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci

您可以很容易地确认这些设置正确工作：

mysql> SHOW VARIABLES WHERE Variable_name LIKE 'character\_set\_%' OR Variable_name LIKE 'collation%';
+--------------------------+--------------------+
| Variable_name            | Value              |
+--------------------------+--------------------+
| character_set_client     | utf8mb4            |
| character_set_connection | utf8mb4            |
| character_set_database   | utf8mb4            |
| character_set_filesystem | binary             |
| character_set_results    | utf8mb4            |
| character_set_server     | utf8mb4            |
| character_set_system     | utf8               |
| collation_connection     | utf8mb4_unicode_ci |
| collation_database       | utf8mb4_unicode_ci |
| collation_server         | utf8mb4_unicode_ci |
+--------------------------+--------------------+
10 rows in set (0.00 sec)

如您所见，所有相关选项都设置为utf8mb4

修复和优化所有表

修复和优化所有表

对要修复和优化的每个表运行以下MySQL查询：

#For each table
REPAIR TABLE table_name;
OPTIMIZE TABLE table_name;
幸运的是，这可以很容易地使用命令行一次完成。mysqlcheck效用：

$ mysqlcheck -u root -p --auto-repair --optimize --all-databases
这将提示根用户的密码，在此之后，所有数据库中的所有表都将被修复和优化。
在这里插入图片描述