解决写入mysql utf8 无法识别4字符编码

通常情况,Mysql数据编码格式为“utf-8”,对于汉字来说足够;Mysql中utf8占3个字节,但是,3个字节对于表情符号是不够的,需4个字节;此时使用utf8,会出现‘\xF0\x9F\x8D\x83\xF0\x9F’的问题。

1、异常

java.sql.BatchUpdateException: Incorrect string value: '\xF0\x9F\x8D\x83\xF0\x9F...' for column 'nickname' at row 1

通常情况,Mysql数据编码格式为“utf-8”,对于汉字来说足够;Mysql中utf8占3个字节,但是,3个字节对于表情符号是不够的,需4个字节;此时使用utf8,会出现‘\xF0\x9F\x8D\x83\xF0\x9F’的问题。

2、解决方法

utf8mb4编码是utf8编码的超集,兼容utf8,并且能存储4字节的表情字符。

整个数据库修改编码格式

修改数据库表的编码格式,修改为utf8mb4;修改Mysql配置文件my.cnf(windows下为my.ini),然后重启数据库

[client] default-character-set = utf8mb4 [mysql] default-character-set = utf8mb4 [mysqld] character-set-client-handshake = FALSE character-set-server = utf8mb4 collation-server = utf8mb4_unicode_ci init_connect='SET NAMES utf8mb4

在连接jdbc的时候,确保

prop.setProperty("charset","utf8mb4")
set character_set_client = utf8mb4 或者 Set Names 'utf8mb4'

或者在代码中,过滤或者拼接识别4字符的编码

public static String removeFourChar(String content) {
    byte[] conbyte = content.getBytes();
    for (int i = 0; i < conbyte.length; i++) {
        if ((conbyte[i] & 0xF8) == 0xF0) {
            for (int j = 0; j < 4; j++) {
                conbyte[i+j]=0x30;
            }
            i += 3;
        }
    }
    content = new String(conbyte);
    return content.replaceAll("0000", "");
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值