JAVA读取TXT文档乱码问题

    最近做一个藏文转码的功能,把藏文字符读取出来,并打印出它的Unicode编码。现贴上代码。

  

import java.io.BufferedInputStream;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;

public class Test{
	
	//取unicode编码
	public static String toHex(byte[] byteArray) {
		int i;
		StringBuffer buf = new StringBuffer("");
		int len = byteArray.length;
		for (int offset = 0; offset < len; offset++) {
			i = byteArray[offset];
			if (i < 0)
				i += 256;
			if (i < 16)
				buf.append("0");
			
			buf.append(Integer.toHexString(i));
		}
		return buf.toString().toUpperCase();
	}
	
	public static String getCharset(String fileName) throws IOException {
		
		BufferedInputStream bin = new BufferedInputStream(new FileInputStream(
				new File(fileName)));
		int p = (bin.read() << 8) + bin.read();
		
		String charset = "";
		
		switch (p) {
			//文件头信息以efbb开始的是UTF-8编码格式
			case 0xefbb:
				charset = "UTF-8";
				break;
			//
			case 0xfffe:
				charset = "Unicode";
				break;
			//
			case 0xfeff:
				charset = "UTF-16BE";
				break;
			default:
				charset = "GBK";
		}
		return charset;
	}
	
	public static void main(String[] args) throws IOException {
		
		//txt文件路径
		String fileName = "C:\\users\\administrator\\Desktop\\班智达.txt";  
		
		//取得txt文件的编码格式
		String charset = getCharset(fileName);
		
		//读入流
		BufferedReader br = new BufferedReader(new InputStreamReader(
				new FileInputStream(new File(fileName)),charset));
		
		String a = br.readLine();		
		//如果是utf-8,要去掉文件头额外的一个字符 \ufeff
		if (charset.equalsIgnoreCase("UTF-8")) {
			a = a.substring(1);
		}
		System.out.println(a);
		char[] ch = a.toCharArray();
		for (int i = 0; i < ch.length; i++) {
			String ss = "\\u" + Integer.toHexString(ch[i]);
			System.out.println(ss);
		}
		
	}
	
}
效果:
刁拜︽搬爸︽伴吵︽椿粹
刁拜︽搬爸︽伴吵︽椿粹
\ufeff
\u5201
\u62dc
\ufe3d
\u642c

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值