十六进制“\u”开头字符串的转码

有时在JS或JAVA属性文件中,常看到“\u”开头的中文字符串,不能知道其到底是什么字符。现在提供一个转码的方法,将其变成可识别的汉字。

代码如下:

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.ByteArrayOutputStream;
import java.io.FileReader;
import java.io.IOException;


import org.apache.commons.lang.StringEscapeUtils;

public class StringTest {
	
	public String fileAsString(String fileName){ 
		BufferedReader  br = null;
		ByteArrayOutputStream bos = null;
		try {
 
			br = new BufferedReader(new FileReader(fileName));
			bos = new ByteArrayOutputStream();
	
			String line = null;
			while ((line = br.readLine()) != null) {
				String line2 = StringEscapeUtils.unescapeJava(line); 
				bos.write(line2.getBytes());
				bos.write("\r\n".getBytes());
			}
			
			String result = new String(bos.toByteArray());
			System.out.println("result:" + result);
			return result;
		} catch (Exception e) {
			e.printStackTrace();
		} finally { 
			if(br != null){
				try {
					br.close();
				} catch (Exception e2) {
					// TODO: handle exception
				}
			} 
		}
		
		return null;
	}

	
	public static void main(String[] args) {
		String file = "d:\\test.js";
		StringTest st = new StringTest();
		st.fileAsString(file);
	}
}

主要手段是通过Apache的commons.lang包(类:org.apache.commons.lang.StringEscapeUtils)来进行转码。

要解码的文件内容形如:

	message:\\\"\u4EB2\u7231\u7684\uFF0C\u4F60\u6162\u6162\u98DE\uFF0C\u5C0F\u5FC3\u524D\u9762\u5E26\u523A\u7684\u73AB\u7470...\\\",
解码结果:

message:\"亲爱的,你慢慢飞,小心前面带刺的玫瑰...\",


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值