通常情况,Mysql数据编码格式为“utf-8”,对于汉字来说足够;Mysql中utf8占3个字节,但是,3个字节对于表情符号是不够的,需4个字节;此时使用utf8,会出现‘\xF0\x9F\x8D\x83\xF0\x9F’的问题。
1、异常
java.sql.BatchUpdateException: Incorrect string value: '\xF0\x9F\x8D\x83\xF0\x9F...' for column 'nickname' at row 1
通常情况,Mysql数据编码格式为“utf-8”,对于汉字来说足够;Mysql中utf8占3个字节,但是,3个字节对于表情符号是不够的,需4个字节;此时使用utf8,会出现‘\xF0\x9F\x8D\x83\xF0\x9F’的问题。
2、解决方法
utf8mb4编码是utf8编码的超集,兼容utf8,并且能存储4字节的表情字符。
整个数据库修改编码格式
修改数据库表的编码格式,修改为utf8mb4;修改Mysql配置文件my.cnf(windows下为my.ini),然后重启数据库
[client] default-character-set = utf8mb4 [mysql] default-character-set = utf8mb4 [mysqld] character-set-client-handshake = FALSE character-set-server = utf8mb4 collation-server = utf8mb4_unicode_ci init_connect='SET NAMES utf8mb4
在连接jdbc的时候,确保
prop.setProperty("charset","utf8mb4")
set character_set_client = utf8mb4 或者 Set Names 'utf8mb4'
或者在代码中,过滤或者拼接识别4字符的编码
public static String removeFourChar(String content) { byte[] conbyte = content.getBytes(); for (int i = 0; i < conbyte.length; i++) { if ((conbyte[i] & 0xF8) == 0xF0) { for (int j = 0; j < 4; j++) { conbyte[i+j]=0x30; } i += 3; } } content = new String(conbyte); return content.replaceAll("0000", ""); }