昨天晚上运营那边反应用户关注公众号并进入了程序,但是页面信息空白。
我进入数据库查看发现没有该用户信息,但是公众号平台有该用户的关注信息,该用户之前之后都有别的用户初始化成功了,查看log定位到用户初始化出现问题,微信昵称有Emoji表情导致插入数据库出现问题。
网上查询有多种解决方法:
- 修改数据库编码格式 :utf8改成了“utf8mb4”
- 将昵称进行Base64加密存储,解密输出
- 存储昵称时进行昵称判断编写过滤emoji工具
- 引入第三方依赖包:emoji-java
第一种 的原理:因为utf8编码的一个字符最多3个字节,但是一个emoji表情为4个字节,所以utf8不支持存储emoji表情。MySQL在5.5.3版本之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思是utf8的超集,所以utf8mb4最多能有4字节,所以能支持emoji表情的存储。但是我修改后没效果,随之放弃。
第二种 Base64加密解密导致数据库存储字符有多长,随之放弃。
第三种 这个方法不错,但是增加了代码,我选择了第四种引入依赖包。
第四种 引入依赖
<dependency>
<groupId>com.vdurmont</groupId>
<artifactId>emoji-java</artifactId>
<version>3.2.0</version>
</dependency>
转换代码 :name 是string类型
EmojiParser.parseToAliases(name);将表情符号转为字符后存储到数据库
EmojiParser.parseToUnicode(name); 将数据库查询字符转为表情符号
2018-12-29 更新
今天又出问题了,有个用户不是Emoji表情,所以引入Emoji依赖包的方法不能用,最后还是用了编码解码方式:
java.net.URLEncode编码 与 URLDecode解码
try {
String name= java.net.URLEncoder.encode(EmojiName, "utf-8");//编码
String name2= java.net.URLDecoder.decode(name,"utf-8");//解码
System.out.println(name);// 控制台显示:%F0%9F%A4%98
System.out.println(name2);//控制台显示:?
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}