如果在移动端发布文本内容时包含了这种Emoji表情符号,通过接口传递到服务器端,服务器端再存入MySQL数据库:
-
对gbk 字符集的数据库,写入数据库的数据,在回显时,变成 ‘口口’ 无法回显;
-
对utf8 字符集的数据库,则根本无法写入数据库,程序直接报出异常信息
java.io.exception xxxxxxxx.
原因分析:
Emoji表情符号为4个字节的字符,而 utf8 字符集只支持1-3个字节的字符,导致无法写入数据库。
解决方案:
-
遍历输入的文本,把四字节长度的字符,修正为自定义的字符替换掉。
-
修改MySQL数据库字符集, 把数据库字符集从utf8 修改为支持1-4 个字节字符的utf8mb4。
事实上可以看出,第一种方案的工作量较大,并不可取。推荐使用第二种方案,修改数据库字符集。从MySQL 5.5.3版本开始,数据库可支持4个字节的utf8mb4 字符集,一个字符最多可以有4个字节,所以能支持更多的字符集,故能存储Emoji表情符号。从 mysql 5.5.3 之后版本基本可以无缝升级到 utf8mb4 字符集。同时,utf8mb4兼容utf8字符集,utf8 字符的编码、位置、存储在utf8mb4与utf8字符集里一样的,不会对有现有数据带来损坏。
3 java 判断字符串中是否包含emoj表情及过滤
package com.luo.dtqjh.utils;
impor