前面说过,文件存储的文本内容,在读和写的时候,是和编码表有关的。例如,如果你是在英文的windows7系统上,打开一个记事本,写入一些中文。如果默认保存,再次打开,可能出现乱码,所以,我们很多人知道需要另存为unicode格式,但是具体的原因不知道,本篇就来学习这个过程,对比GBK和utf-8两个编码表读写文件的过程。
1.默认编码表读写文件
项目下创建一个gbk和一个utf-8两个文本文件,内容都写“学习Java编程是一个长期的过程”。然后运行下面代码。
package io;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
public class Demo6_TransIO {
public static void main(String[] args) throws IOException {
FileReader fr = new FileReader("utf-8.txt");
FileWriter fw = new FileWriter("gbk.txt");
int c;
while ( (c = fr.read()) != -1) {
fw.write(c);
}
fr.close();
fw.close();
}
}
运行之后,刷新项目,然后打开项目下gbk.txt文件,会发现显示乱码。因为utf-8编码方式是默认采用3个字节存储一个字符,而gbk默认是2个字节存储一个汉字。为了防止这样情况出现,我们就需要给文件读写加上字符编码,确保读写都正常,不会发生乱码情况。
2.指定编码方式去读写文件
上面使用到的FileReader是使用默认编码表来读文件,FileWriter也是使用默认编码表来写文件。为了指定编码表去读写文件,我们需要使用者两个类。InputStreamReader(字符流,编码表) 和 OutStreamWriter(字符流,编码表),下面来看一个例子。
package io;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
public class Demo6_TransIO {
public static void main(String[] args) throws IOException {
InputStreamReader isr = new InputStreamReader(new FileInputStream("utf-8.txt"),"utf-8");
OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("gbk.txt"), "gbk");
int c;
while ( (c = isr.read()) != -1) {
osw.write(c);
}
isr.close();
osw.close();
}
}
由于写入的gbk.txt文件,指定了编码表,所以如果你系统支持gbk编码,那么就能正常打开。实际上,我们发现,读的字符流是ut-8类型,写的字符流是gbk编码表,底层肯定发生了字符转换。为了增加读写效率,我们把上面代码用缓冲区方式优化下。
3.带缓冲区的指定编码读写文件
package io;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.io.UnsupportedEncodingException;
public class Demo6_TransIO {
public static void main(String[] args) throws IOException {
//demo1();
//demo2();
BufferedReader br =
new BufferedReader(new InputStreamReader(new FileInputStream("utf-8.txt"),"utf-8"));
BufferedWriter bw =
new BufferedWriter(new OutputStreamWriter(new FileOutputStream("gbk.txt"),"gbk"));
int c;
while ((c = br.read()) != -1) {
bw.write(c);
}
br.close();
bw.close();
}
public static void demo2() throws UnsupportedEncodingException, FileNotFoundException, IOException {
InputStreamReader isr = new InputStreamReader(new FileInputStream("utf-8.txt"),"utf-8");
OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("gbk.txt"), "gbk");
int c;
while ( (c = isr.read()) != -1) {
osw.write(c);
}
isr.close();
osw.close();
}
public static void demo1() throws FileNotFoundException, IOException {
FileReader fr = new FileReader("utf-8.txt");
FileWriter fw = new FileWriter("gbk.txt");
int c;
while ( (c = fr.read()) != -1) {
fw.write(c);
}
fr.close();
fw.close();
}
}