mysql utf8 emoji_mysql设置utf8编码导致无法存储emoji表情解决方案

mysql中的”utf8“最大只支持3 个bytes,而真正的utf8编码(大家都使用的标准),最大支持4个bytes。正是由于mysql的utf8少一个byte,导致中文的一些特殊字符和emoji都无法正常的显示。mysql真正的utf8其实是utf8mb4,这是在5.5版本之后加入的。而目前的“utf8”其实是utf8mb3。mb就是 max bytes的意思(猜测)。所以尽量不要使用默认的utf8,使用utf8mb4才是正确的选择。

但是一些老项目默认数据库格式为utf8,可能就需要通过Java的方式进行转换,此处提供一个工具类进行编码转换

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class enCoderUtils {

/**

* 将str中的emoji表情转为byte数组

*

* @param str

* @return

*/

public static String resolveToByteFromEmoji(String str) {

Pattern pattern = Pattern

.compile("[^(\u2E80-\u9FFF\\w\\s`~!@#\\$%\\^&\\*\\(\\)_+-?()——=\\[\\]{}\\|;。,、《》”:;“!……’:'\"\\.?/\\\\*)]");

Matcher matcher = pattern.matcher(str);

StringBuffer sb2 = new StringBuffer();

while (matcher.find()) {

matcher.appendReplacement(sb2, resolveToByte(matcher.group(0)));

}

matcher.appendTail(sb2);

return sb2.toString();

}

/**

* 将str中的byte数组类型的emoji表情转为正常显示的emoji表情

*

* @param str

* @return

*/

public static String resolveToEmojiFromByte(String str) {

Pattern pattern2 = Pattern.compile("<:>");

Matcher matcher2 = pattern2.matcher(str);

StringBuffer sb3 = new StringBuffer();

while (matcher2.find()) {

matcher2.appendReplacement(sb3, resolveToEmoji(matcher2.group(0)));

}

matcher2.appendTail(sb3);

return sb3.toString();

}

private static String resolveToByte(String str) {

byte[] b = str.getBytes();

StringBuffer sb = new StringBuffer();

sb.append("<:>

for (int i = 0; i < b.length; i++) {

if (i < b.length - 1) {

sb.append(Byte.valueOf(b[i]).toString() + ",");

} else {

sb.append(Byte.valueOf(b[i]).toString());

}

}

sb.append(":>");

return sb.toString();

}

private static String resolveToEmoji(String str) {

str = str.replaceAll("<:>", "");

String[] s = str.split(",");

byte[] b = new byte[s.length];

for (int i = 0; i < s.length; i++) {

b[i] = Byte.valueOf(s[i]);

}

return new String(b);

}

}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值