字符串转换为unicode码:
StringEscapeUtils.escapeJava("我们");
unicode码转为字符串:
StringEscapeUtils.unescapeJava("\u6211\u4EEC");
Java的默认编码是什么,真是各说纷纭,这里强调一下:
Java在JVM内存中使用的编码都是:Unicode
Java在读取操作系统文件的时候编码是:GBK(与操作系统的编码一致)
Unicode与中文字符转换测试代码:package com.what21.unicode;
import java.io.UnsupportedEncodingException;
public class What21Unicode {
/**
* @param args
*/
public static void main(String[] args) {
// 字符
String str = "我们";
System.out.println(str);
// unicode编码字符
String unicode = "\u6211\u4EEC";
System.out.println(unicode);
// 看看该编码
byte[] bytes = null;
try {
bytes = "我们".getBytes("UTF-16BE");
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
for(int i=0;i
String cStr = Integer.toHexString(bytes[i]);
if(cStr.length()>=8){
cStr = cStr.substring(6,8);
}
System.out.print(cStr + " ");
}
System.out.println();
}
}