从txt文件读取u8584之类的转换成相应的utf-8汉字的方法

因为每次从txt文件读取一个u开始的汉字的时候,程序认为它就是一个普通的字符串序列,所以我们必须把它转换成我们需要的utf编码的字符序列,这里用到了java.util.property类里的一个方法来把不同的字符串转换为utf需要的字符串序列,
方法如下:

package com.community.test;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStreamReader;

public class test {


public static void main(String args[]) {
try {

char []inc=new char[1024];
char []outc=new char[6];

//文件内容为u8584
BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(new File("d:/log/test.txt"))));

String line = "";
while ((line = br.readLine()) != null) {
inc=getChars(line);
String temp=loadConvert(inc,0,inc.length,outc);
System.out.println(line);
System.out.println(temp);

}

br.close();
} catch (Exception e) {
e.printStackTrace();
}
}

public static char[] getChars(String s) {
char c[]=new char[s.length()];
for (int i = 0; i < s.length(); i++) {
c[i]=s.charAt(i);
}
return c;
}

private static String loadConvert (char[] in, int off, int len, char[] convtBuf) {
if (convtBuf.length < len) {
int newLen = len * 2;
if (newLen < 0) {
newLen = Integer.MAX_VALUE;
}
convtBuf = new char[newLen];
}
char aChar;
char[] out = convtBuf;
int outLen = 0;
int end = off + len;

while (off < end) {
aChar = in[off++];
if (aChar == '') {
aChar = in[off++];
if(aChar == 'u') {
// Read the xxxx
int value=0;
for (int i=0; i<4; i++) {
aChar = in[off++];
switch (aChar) {
case '0': case '1': case '2': case '3': case '4':
case '5': case '6': case '7': case '8': case '9':
value = (value << 4) + aChar - '0';
break;
case 'a': case 'b': case 'c':
case 'd': case 'e': case 'f':
value = (value << 4) + 10 + aChar - 'a';
break;
case 'A': case 'B': case 'C':
case 'D': case 'E': case 'F':
value = (value << 4) + 10 + aChar - 'A';
break;
default:
throw new IllegalArgumentException(
"Malformed uxxxx encoding.");
}
}
out[outLen++] = (char)value;
} else {
if (aChar == 't') aChar = ' ';
else if (aChar == 'r') aChar = ' ';
else if (aChar == 'n') aChar = ' ';
else if (aChar == 'f') aChar = 'f';
out[outLen++] = aChar;
}
} else {
out[outLen++] = (char)aChar;
}
}
return new String (out, 0, outLen);
}
}

输出:

u8584

[@more@]

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/750220/viewspace-932325/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/750220/viewspace-932325/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值