以“utf8”编码的MariaDB中保存一个UTF-8字符串,然后出现了一个离奇的错误:
Incorrect string value: ‘😃 <…’ for column ‘summary’ at row 1
我用的是UTF-8编码的客户端,服务器也是UTF-8编码的,数据库也是,就连要保存的这个字符串“? <…”也是合法的UTF-8。
问题的症结在于,MySQL的“utf8”实际上不是真正的UTF-8。
“utf8”只支持每个字符最多三个字节,而真正的UTF-8是每个字符最多四个字节。
简单概括如下:
1.MySQL的“utf8mb4”是真正的“UTF-8”。
2.MySQL的“utf8”是一种“专属的编码”,它能够编码的Unicode字符并不多。
我要在这里澄清一下:所有在使用“utf8”的MySQL和MariaDB用户都应该改用“utf8mb4”,永远
修改默认编码
vi /etc/my.cnf
[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
您可以很容易地确认这些设置正确工作:
mysql> SHOW VARIABLES WHERE Variable_name LIKE 'character\_set\_%' OR Variable_name LIKE 'collation%';
+--------------------------+--------------------+
| Variable_name | Value |
+--------------------------+--------------------+
| character_set_client | utf8mb4 |
| character_set_connection | utf8mb4 |
| character_set_database | utf8mb4 |
| character_set_filesystem | binary |
| character_set_results | utf8mb4 |
| character_set_server | utf8mb4 |
| character_set_system | utf8 |
| collation_connection | utf8mb4_unicode_ci |
| collation_database | utf8mb4_unicode_ci |
| collation_server | utf8mb4_unicode_ci |
+--------------------------+--------------------+
10 rows in set (0.00 sec)
如您所见,所有相关选项都设置为utf8mb4
修复和优化所有表
修复和优化所有表
对要修复和优化的每个表运行以下MySQL查询:
#For each table
REPAIR TABLE table_name;
OPTIMIZE TABLE table_name;
幸运的是,这可以很容易地使用命令行一次完成。mysqlcheck效用:
$ mysqlcheck -u root -p --auto-repair --optimize --all-databases
这将提示根用户的密码,在此之后,所有数据库中的所有表都将被修复和优化。
记住:永远不要在MySQL中使用UTF-8https://mp.weixin.qq.com/s/nVtk84VP-7_lr6GhuTDqYQ