java读取文本文件编码格式_JAVA读取不同编码的txt文件,java获取txt文件编码格式 | 学步园...

该博客介绍了如何使用Java读取不同编码格式的TXT文件,提供了一个名为`getCharset`的函数,通过判断文件头字节来确定编码,如UTF-8、Unicode、UTF-16BE或GBK。此外,还展示了`getTextFromText`方法用于读取整个文件内容。文章中提到某些其他方法可能不可靠。

下面这个函数亲测实验成功。

获取txt编码格式函数如下:

private String getCharset(String fileName) throws IOException{

BufferedInputStream bin = new BufferedInputStream(new FileInputStream(fileName));

int p = (bin.read() << 8) + bin.read();

String code = null;

switch (p) {

case 0xefbb:

code = "UTF-8";

break;

case 0xfffe:

code = "Unicode";

break;

case 0xfeff:

code = "UTF-16BE";

break;

default:

code = "GBK";

}

return code;

}

测试读取文件:

public String getTextFromText(String filePath){

try {

InputStreamReader isr = new InputStreamReader(new FileInputStream(filePath),getCharset(filePath));

BufferedReader br = new BufferedReader(isr);

StringBuffer sb = new StringBuffer();

String temp = null;

while((temp = br.readLine()) != null){

sb.append(temp);

}

br.close();

return sb.toString();

} catch (FileNotFoundException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

return null;

}

原文http://blog.sina.com.cn/s/blog_68ed2a9b0100vqrn.html

备注:

实验发现这篇文章(http://tinyking.blog.51cto.com/3338571/667453)给的方法不行。

InputStream inputStream = new FileInputStream("E:/1.txt");

byte[] head = new byte[3];

inputStream.read(head);

String code = "";

code = "gb2312";

if (head[0] == -1 && head[1] == -2 )

code = "UTF-16";

if (head[0] == -2 && head[1] == -1 )

code = "Unicode";

if(head[0]==-17 && head[1]==-69 && head[2] ==-65)

code = "UTF-8";

System.out.println(code);

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值