在做微信小程序保存用户信息(昵称中带emoji表情)时,报错:
java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x92\x94’ for column ‘nickname’ at row 1
原因:utf-8编码可能2个字节、3个字节、4个字节的字符,但是MySQL的utf8编码只支持3字节的数据,而移动端的表情数据是4个字节的字符。如果直接往采用utf-8编码的数据库中插入表情数据,Java程序中将报SQL异常。
解决办法:更改数据库的编码为utf8mb4,utf8mb4编码是utf8编码的超集,兼容utf8,并且能存储4字节的表情字符。
前提:mysql支持utf8mb4的版本不低于5.5.3,mysql驱动版本不能低于5.1.13。若不是,升级到最新版本。
一、命令行连接mysql后查看系统变量:
SHOW VARIABLES WHERE Variable_name LIKE ‘character_set_%’ OR Variable_name LIKE ‘collation%’;
二、修改mysql配置文件my.cnf(windows为my.ini)
my.cnf一般在etc/my.cnf位置。找到后请在以下三部分里添加如下内容:
[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect='SET NAMES utf8mb4'
三、重启mysql
service mysqld stop
service mysqld start
四、再次查看系统变量
character_set_client(客户端来源数据使用的字符集)
character_set_connection(连接层字符集)
character_set_database(当前选中数据库的默认字符集)
character_set_results(查询结果字符集)
character_set_server(默认的内部操作字符集)
以上变量必须是utf8mb4
五、将数据库和表的编码改为utf8mb4
更改数据库编码:
alter database 数据库名称 character set =utf8mb4 collate utf8mb4_general_ci;
更改表编码:
alter table 表名 convert to character set utf8mb4 collate utf8mb4_general_ci;
这里排序规则采用utf8mb4_general_ci和utf8mb4_unicode_ci似乎都可以,我在项目中采用默认utf8mb4_general_ci,并把表中昵称列的排序规则更改为utf8mb4_unicode_ci,测试没有问题。
六、设置jdbc连接配置
jdbc:mysql://localhost:3306/dbname?useUnicode=true&characterEncoding=utf8&autoReconnect=true
useUnicode=true当时因为没加这个参数,数据库录入乱码,找了好久。。。
测试录入成功木有乱码,美滋滋