如何将不可读的中文数据转化为汉字
抓取到数据
我们在项目中经常会抓到Json数据,当我们遇到数据里面存在中文的时候,该怎么办呢?
{"userId":"209574389","code":"1026","message":"\345\205\203\346\260\224\345\200\274\345\200\274\344\270\215\350\266\263","tag":null,"intfId":"14788634235882053253055993632507"}
里面“\”后面的数字是不是中文呢?只有转化一下才知道,要不然谁能看懂呢?就是下面的转化数据了,用什么解码方式转化呢?当时是UTF-8了,就是因为UnniCode编码统一世界了。尤其Android以后UTF-8成了主流。当然如果UTF-8解出的是乱码,可以换个方式解码。
解码代码
String str = "\\345\\205\\203\\346\\260\\224\\345\\200\\274\\345\\200\\274\\344\\270\\215\\350\\266\\263";
Pattern pattern = Pattern.compile("\\\\");
String[] strs = pattern.split(str);
StringBuffer sb = new StringBuffer();
for (String s : strs) {
if (s != null && s.trim().length() > 0) {
String st = Integer.toHexString(Integer.valueOf(s, 8));
sb.append("%").append(st);
}
}
try {
System.out.println(URLDecoder.decode(sb.toString(), "utf-8"));
} catch (Exception e) {
e.printStackTrace();
}
就是这样,如果顺利的话,就可以转化出来了。