关闭

中文到unicode编码转换

340人阅读 评论(0) 收藏 举报
 代码:

/**
* 中文到unicode编码的转换
*/
public class UnicodeTest {

public static void main(String[] args) {
    String cn = "怀念外婆屋后的柚子树";
    System.out.println(cnToUnicode(cn));
    // 字符串 : \u5f00\u59cb\u4efb\u52a1 ,由于 \ 在java里是转义字符,要写出下面这种形式
    String unicode = "\\u5f00\\u59cb\\u4efb\\u52a1";
    System.out.println(unicodeToCn(unicode));
}

private static String unicodeToCn(String unicode) {
    /** 以 \ u 分割,因为java注释也能识别unicode,因此中间加了一个空格*/
    String[] strs = unicode.split("\\\\u");
    String returnStr = "";
    // 由于unicode字符串以 \ u 开头,因此分割出的第一个字符是""。
    for (int i = 1; i < strs.length; i++) {
      returnStr += (char) Integer.valueOf(strs[i], 16).intValue();
    }
    return returnStr;
}

private static String cnToUnicode(String cn) {
    char[] chars = cn.toCharArray();
    String returnStr = "";
    for (int i = 0; i < chars.length; i++) {
      returnStr += "\\u" + Integer.toString(chars[i], 16);
    }
    return returnStr;
}

}

    同时,在jdk的bin目录下有个转换工具:native2ascii,运行native2ascii则可转换成unicode码,带参数运行:native2ascii -reverse,则可从unicode码转成原有字符。

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:772550次
    • 积分:8172
    • 等级:
    • 排名:第2449名
    • 原创:74篇
    • 转载:431篇
    • 译文:0篇
    • 评论:39条
    最新评论