MySQL插入emoji表情错误的3种解决方案，Incorrect string value: '\xF0\x9F\x98\x84'

最新推荐文章于 2024-09-15 10:36:48 发布

JAVA道人

最新推荐文章于 2024-09-15 10:36:48 发布

阅读量2.8w

点赞数 8

分类专栏： # mysql # 微信公众号小程序

本文链接：https://blog.csdn.net/dmw412724/article/details/81119325

版权

mysql 同时被 2 个专栏收录

48 篇文章 0 订阅

订阅专栏

微信公众号小程序

36 篇文章 0 订阅

订阅专栏

原因：mysql的UTF-8只支持三个字节的存储，而一般字符是三个字节，但是emoji表情是4个字节，所以存储不了。

而mysql为了解决这个问题，在5.5.3版本之后转而支持了存储4个字节的utf8字符，字符集为utf8mb4.这个相当于windowsX64和windowsX86的区别，64位是兼容32位的，也就是说utf8mb4存取utf8都是没有问题的。

那么在有表情的字段上就应该这样做,将该字段设置为utf8mb4

 ALTER TABLE table_name MODIFY  colum_name  VARCHAR(100) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci

然而你还需要设置下表的字符集

 ALTER TABLE table_name CHARSET=utf8mb4;

当然你可能还需要设置本数据库为utf8mb4啊

 SET NAMES utf8mb4

然后启动起来。

可是在服务器和数据库连接的地方怎么办？

jdbc.url=jdbc:mysql://localhost:3306/aaa?useUnicode=true&characterEncoding=utf-8

这里这个utf-8要改成utf8mb4吗?

貌似不能改啊，数据库驱动就这些编码，没法改啊，一改就出错，不过没事，这是可以兼容的,对于jdbc的驱动来说.

既然没事，那就测试存储吧。

我不清楚原理，只知道现象。

那么接下来会出现两个现象，

第一：你可以存储表情了。

第二：由于未知原因，你还是不能存储表情。

对于第二种情况的同学，我要告诉你的是，当你去操作这些需要加入表情的字段之前，请插入这条sql语句。

 SET NAMES utf8mb4

即可。

也就是说每次插入啊修改啊之前都set一次就没有问题了。

相信我，绝对可行。

当然，有更省事的方法，那么以上几段话当我没说，啥东西都不用改，我们从另一个角度来看问题，其实我们在存的时候过滤掉表情即可，就不用担心以后各种取各种兼容各种显示了。

<!-- https://mvnrepository.com/artifact/com.vdurmont/emoji-java -->
<dependency>
    <groupId>com.vdurmont</groupId>
    <artifactId>emoji-java</artifactId>
    <version>4.0.0</version>
</dependency>

这个包里，有这个方法

String string = EmojiParser.removeAllEmojis(param);

ok了。拿到这个来存不就行了吗？

第三种方案:

字符串是万金油,但是字节数组是万金油之王.我们可以对这种字段不存储varchar类型,而是存储varbinary,

这是一种可变的二进制存储.对应的java类型则是byte[]

例子:

String aa ="?";
       Test record = new Test();
       record.setV2(aa.getBytes("utf-8"));
       mapper.insert(record);
       System.out.println(mapper.selectByPrimaryKey(2));

//Test [id=2, v1=null, v2=?]

由此方案可以延伸出存储字节数组的字符串形式/base64形式等,其本质均是存储的字节数组.