java,汉字转unicode码|unicode转汉字

原创 2013年12月05日 10:37:24

一、java,汉字转unicode码|unicode转汉字:

public class UnicodeStr {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		System.out.println(str2Unicode("最真不过平淡,最美不过平凡。"));
		System.out.println(unicode2Str("\u6700\u771f\u4e0d\u8fc7\u5e73\u6de1\uff0c\u6700\u7f8e\u4e0d\u8fc7\u5e73\u51e1\u3002"));
	}

	 public static String str2Unicode(String s)
	  {
	    String str = "";
	    if ((s == null) || (s.trim().equals("")))
	      return str;
	    for (int i = 0; i < s.length(); i++)
	    {
	      byte[] bytes = String.valueOf(s.charAt(i)).getBytes();
	      String s4;
	      if (bytes.length == 1)
	      {
	        s4 = String.valueOf(s.charAt(i));
	      } else {
	        int ch = s.charAt(i);
	        s4 = "\\u" + Integer.toHexString(ch);
	      }
	      str = str + s4;
	    }
	    return str;
	  }

	 public static String unicode2Str(String theString) {
		  char aChar;
		  int len = theString.length();
		  StringBuffer outBuffer = new StringBuffer(len);
		  for (int x = 0; x < len;) {
		   aChar = theString.charAt(x++);
		   if (aChar == '\\') {
		    aChar = theString.charAt(x++);
		    if (aChar == 'u') {
		     int value = 0;
		     for (int i = 0; i < 4; i++) {
		      aChar = theString.charAt(x++);
		      switch (aChar) {
		      case '0':
		      case '1':
		      case '2':
		      case '3':
		      case '4':
		      case '5':
		      case '6':
		      case '7':
		      case '8':
		      case '9':
		       value = (value << 4) + aChar - '0';
		       break;
		      case 'a':
		      case 'b':
		      case 'c':
		      case 'd':
		      case 'e':
		      case 'f':
		       value = (value << 4) + 10 + aChar - 'a';
		       break;
		      case 'A':
		      case 'B':
		      case 'C':
		      case 'D':
		      case 'E':
		      case 'F':
		       value = (value << 4) + 10 + aChar - 'A';
		       break;
		      default:
		       throw new IllegalArgumentException(
		         "Malformed      encoding.");
		      }

		     }
		     outBuffer.append((char) value);
		    } else {
		     if (aChar == 't') {
		      aChar = '\t';
		     } else if (aChar == 'r') {
		      aChar = '\r';
		     } else if (aChar == 'n') {
		      aChar = '\n';
		     } else if (aChar == 'f') {
		      aChar = '\f';
		     }
		     outBuffer.append(aChar);
		    }
		   } else {
		    outBuffer.append(aChar);
		   }

		  }
		  return outBuffer.toString();

		 }

}

二、还有一种文字转unicode方法就是安装了java的jdk后就可以用bin目录下的native2ascii.exe来转换。先将要转换的文字写入一个文本文件,如str.txt ,则在命令行方式下键入命令:native2ascii str.txt (这个网上看到的,未测试)

 

相关文章推荐

Unicode字符与GB2312的相互转换

本文转自:http://blog.csdn.net/feng2007110221053/article/details/6365423   使用JDK中的native2ascii.exe工具。(以...

Unicode汉字互转工具源码

  • 2013年05月28日 19:43
  • 79KB
  • 下载

java汉字和unicode互转

java汉字和unicode互转

汉字转ASKII码,UNICODE码,UTF8码

  • 2013年11月11日 18:00
  • 1.68MB
  • 下载

Unicode字符集批量转码为汉字(互转)

看到网上不少地方传输中文的时候用的是类似/u4e2d/u56fd的字符,就是Unicode编码的字符,想知道具体什么内容,又不容易看出来,所以想把这个字符集解码为正常的字符。 开始我通过Encodi...

汉字与Unicode互转

  • 2013年07月17日 16:37
  • 5KB
  • 下载

使用jdk工具将汉字转化为Unicode码(java)

汉字和Unicode码转化(java) 运用了jdk里面native2ascii.exe 详细目录如图所示: 1、可直接在native2ascii.exe中输入要转换的汉字 如图: 很容易看...
  • UckyK
  • UckyK
  • 2014年12月01日 14:46
  • 603

汉字转Unicode工具 小巧方便

  • 2014年05月06日 21:44
  • 5KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:java,汉字转unicode码|unicode转汉字
举报原因:
原因补充:

(最多只允许输入30个字)