统一码(Unicode),也叫万国码、单一码,是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
简单来说就是全球通行的一种编码。
下面提供一种好用的
unicode转中文,中文转unicode的方法:
//Unicode转中文方法
private static String unicodeToCn(String unicode) {
/** 以 \ u 分割,因为java注释也能识别unicode,因此中间加了一个空格*/
String[] strs = unicode.split("\\\\u");
String returnStr = "";
// 由于unicode字符串以 \ u 开头,因此分割出的第一个字符是""。
for (int i = 1; i < strs.length; i++) {
returnStr += (char) Integer.valueOf(strs[i], 16).intValue();
}
return returnStr;
}
//中文转Unicode
private static String cnToUnicode(String cn) {
char[] chars = cn.toCharArray();
String returnStr = "";
for (int i = 0; i < chars.length; i++) {
returnStr += "\\u" + Integer.toString(chars[i], 16);
}
return returnStr;
}
//测试
@Test
public void test27() {
//Unicode码
String aa = "\\u554a\\u554a\\u554a";
//转中文
String cnAa = unicodeToCn(aa);
System.out.println("Unicode转中文结果: "+cnAa);
String unicodeAa = cnToUnicode("啊啊啊");
System.out.println("中文转Unicode结果: "+unicodeAa);
}