java写txt文件格式发生变化_Java读写包括中文的txt文件时不同编码格式问题解决...

在程序中,文本文件经常用来存储标准的ASCII码文本,比如英文、加减乘除等号这些运算符号。文本文件也可能用于存储一些其他非ASCII字符,如基于GBK的简体中文,基于GIG5的繁体中文等等。在存储这些字符时需要正确指定文件的编码格式;而在读取这些文本文件时,有时候就需要自动判定文件的编码格式。      按照给定的字符集存储文本文件时,在文件的最开头的三个字节中就有可能存储着编码信息,所以,基本的原理就是只要读出文件前三个字节,判定这些字节的值,就可以得知其编码的格式。其实,如果项目运行的平台就是中文操作系统,如果这些文本文件在项目内产生,即开发人员可以控制文本的编码格式,只要判定两种常见的编码就可以了:gbk和utf-8。由于中文windows默认的编码是gbk,所以一般只要判定utf-8编码格式。      对于UTF-8编码格式的文本文件,其前3个字节的值就是-17、-69、-65,所以,判定是否是UTF-8编码格式的代码片段如下:

java.io.file f=new java.io.file("待判定的文本文件名");

byte[] b=newbyte[3];

ios.read(b);

ios.close();

if(b[0]==-17&&b[1]==-69&&b[2]==-65)

system.out.println(f.getname()+"编码为utf-8");

else System.out.println(f.getName()+"可能是GBK");

}

问题:在用Java程序进行读写含中文的txt文件时,经常会出现读出或写入的内容会出现乱码。原因其实很简单,就是系统的编码和程序的编码采用了不同的编码格式。通常,假如自己不修改的话,windows自身采用的编码格式是gbk(而gbk和gb2312基本上是一样的编码方式),而IDE中Encode不修改的话,默认是utf-8的编码,这就是为什么会出现乱码的原因。当在OS下手工创建并写入的txt文件(gbk),用程序直接去读(utf-8),就会乱码。为了避免可能的中文乱码问题,最好在文件写入和读出的时候显式指定编码格式。

1、写文件:

publicstaticvoid writeFile(String fileName, String fileContent)

{

try

{

File f = new File(fileName);

if (!f.exists())

{

f.createNewFile();

}

OutputStreamWriter write = new OutputStreamWriter(new FileOutputStream(f),"gbk");

BufferedWriter writer=new BufferedWriter(write);

writer.write(fileContent);

writer.close();

} catch (Exception e)

{

e.printStackTrace();

}

}

try

2、读文件:

publicstatic String readFile(String fileName)

{

String fileContent = "";

try

{

File f = new File(fileName);

if(f.isFile()&&f.exists())

{

InputStreamReader read = new InputStreamReader(new FileInputStream(f),"gbk");

BufferedReader reader=new BufferedReader(read);

String line;

{

fileContent += line;

}

read.close();

}

} catch (Exception e)

{

e.printStackTrace();

}

return fileContent;

}

3.代码示例

import org.apache.commons.io.fileutils;

String filePath="D:/test.txt";

String fileEncode=EncodingDetect.getJavaEncode(filePath);

String fileContent=FileUtils.readFileToString(new File(filePath),fileEncode);

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值