今天研究了一下Unicode,写了个普通字符串转Unicode的程序,同时又写了个方法可以把本程序输出的Unicode字符串转化 回普通字符串。
但是奇怪的是,从别人那里复制过来的Unicode字符串,直接用输出就可以得到普通字符串,如果用程序中的方法,反而不行。
看来是在给String赋值的时候,已经被系统自动转化了。
import java.util.regex.*;
public class Test{
private static StringBuilder sb = new StringBuilder();
private static Pattern p = Pattern.compile("\\\\u[\\da-f]{4}");
public static void main(String[] args){
String s2 = stringToUnicode("抓住楼主枪毙两分钟");
System.out.println(s2);
}
public static String stringToUnicode(String s){
sb.setLength(0);//清零
StringBuilder tmp = new StringBuilder();
for(int i = 0; i < s.length(); i++){
sb.append("\\u"); //以 \ u开头
tmp.setLength(0); //清零
tmp.append(Integer.toHexString(s.charAt(i)).toLowerCase());
while(tmp.length() < 4){
tmp.insert(0, 0);
}
sb.append(tmp);
}
return sb.toString();
}
public static String unicodeToString(String s){
s = s.toLowerCase();
sb.setLength(0);
Matcher m = p.matcher(s);
while(m.find()){
sb.append((char)Integer.parseInt(m.group().substring(2), 16));
}
return sb.toString();
}
}
版权声明:本文为博主原创文章,未经博主允许不得转载。