大概是这样:
windows系统默认编码为GBK,
如果你的eclipse工作空间编码设为:UTF-8。
如果文件中有中文则会乱码。
先在N盘下创建一个test.txt文件,里面写入一下内容,保存。
然后通过FileReader获取test.txt的字符流,然后用BufferrReader读取字符输入流中的文本,并打印到控制台。
public static void main(String[] args) throws Exception {
String str;
FileReader file = new FileReader("n:/test.txt");
BufferedReader reader = new BufferedReader(file);
while((str=reader.readLine())!=null) {
System.out.println(str);
}
file.close();
reader.close();
}
打印结果如下:
出现乱码。这是因为Windows系统的文件以GBK的方式编码,然后FileReader以工作空间默认的UTF-8方式解码。所以才会出现乱码。
相当于:
byte[] by = "好好学习,天天向上。".getBytes("gbk");
String str3 = new String(by,"utf-8");
System.out.println(str3);
如果以一下用new String(str.getBytes(“utf-8”),“gbk”),"utf-8"来还原编码,"gbk"再重新解码,看起来没啥问题:但是通过实验来看还是有问题的。
public static void main(String[] args) throws Exception {
String str;
FileReader file = new FileReader("n:/test.txt");
BufferedReader reader = new BufferedReader(file);
while((str=reader.readLine())!=null) {
str=new String(str.getBytes("utf-8"),"gbk");
System.out.println(str);
}
file.close();
reader.close();
}
结果如下:
这和我们想要的结果不一样,说明用"utf-8"编码回去的过程中出现了错误,所以再用"GBK"解码就会得到不正确的结果。
相当于:
byte[] by = "好好学习,天天向上。".getBytes("gbk");
String str3 = new String(by,"utf-8");
str3 = new String(str3.getBytes("utf-8"),"gbk");
System.out.println(str3);
根据我现在的知识,解决方法有以下两种:
1:把你的工作空间编码方式改为"GBK"。
2:用InputStreamReader代替FileReader
代码如下:
public static void main(String[] args) throws Exception {
String str;
InputStreamReader file = new InputStreamReader(new FileInputStream("n:/test.txt"),"GBk");
//FileReader file = new FileReader("n:/test.txt");
BufferedReader reader = new BufferedReader(file);
while((str=reader.readLine())!=null) {
//str=new String(str.getBytes("utf-8"),"gbk");
System.out.println(str);
}
file.close();
reader.close();
}
通过以上代码我们指明了以"GBK"的方式解码,这样它就不会用工作空间默认的解码方式解码了,运行结果如下:
这和我们想要的结果一样,OK,问题解决,还有什么解决的方法就得自己慢慢了解了。