Java读取UTF-8格式txt文件第一行出现乱码——问号“?”及解决;Java读带有BOM的UTF-8文件乱码原因及解决方法

本文介绍了Java在读取UTF-8格式的txt文件时遇到的第一行乱码问题,主要是由于BOM(Byte Order Mark)引起的。通过使用特定的处理方式,如使用`UnicodeReader`或在读取文件时指定`UTF-8无BOM`格式,可以解决这个问题。测试代码展示了如何正确读取带BOM的UTF-8文件。
摘要由CSDN通过智能技术生成
Java读取UTF-8的txt文件第一行出现乱码“?”及解决


test.txt文件内容:
A中
2国
3
4
5
6

test.txt文件采用写字板保存为UTF-8格式
保存并关闭后使用写字板再次打开该UTF-8文档,中文、字母正常显示

测试代码:

  1. import java.io.BufferedReader;
  2. import java.io.File;
  3. import java.io.FileInputStream;
  4. import java.io.InputStreamReader;
  5. public class ReadTxtFile {
  6. public static void main(String[] args) {
  7. try {
  8. String charsetName = "UTF-8";
  9. String path = "D:/to_delete/test.txt";
  10. File file = new File(path);
  11. if (file.isFile() && file.exists())
  12. {
  13. InputStreamReader insReader = new InputStreamReader(
  14. new FileInputStream(file), charsetName);
  15. BufferedReader bufReader = new BufferedReader(insReader);
  16. String line = new String();
  17. while ((line = bufReader.readLine()) != null) {
  18. System.out.println(line);
  19. }
  20. bufReader.close();
  21. insReader.close();
  22. }
  23. } catch (Exception e) {
  24. System.out.println("读取文件内容操作出错");
  25. e.printStackTrace();
  26. }
  27. }
  28. }

程序执行结果:
?A中
2国
3
4
5
6

我的解决办法:

使用UltraEdit将上边的txt文件另存为UTF-8无BOM格式;

或者

使用Notepad++打开上边的txt文件执行如下操作“格式-->以UTF-8无BOM格式编码”,修改后将txt文本进行保存。

网上有篇非常好的文章,论述了问题出现的原因及解决办法

Java读带有BOM的UTF-8文件乱码原因及解决方法

url:http://daimojingdeyu.javaeye.com/blog/397661

关键字: java 读utf-8, java写utf-8, 编码, utf-8 乱码

最近在处理文件时发现了同样类型的文件使用的编码可能是不同的。所以想将文件的格式统一一下(因为UTF-8的通用性,决定往UTF-8统一),遇见的第一个问题是:如何查看现有文件的编码方式。

上网找了一下,找到几篇比较好文章,这里就不转载啦把链接搞过来。
文件编码问题集锦
字符串编码(charset,encoding,decoding)问题原理
Java编码浅析
判定文件编码或文本流编码的方法
上面的几篇文章可以看成认识编码问题的“从入门到精通”

如果你看完了上面的文章,一定了解到了,在java中,class文件采用utf8的编码方式,JVM运行时采用utf16。Java的字符串是永远都是unicode的,采用的是UTF-16的编码方式。

想测试一下,java对UTF-8文件的读写的能力,结果发现了一个很郁闷的问题,如果通过java写的UTF-8文件,使用Java可以正确的读,但是如果用记事本将相同的内容使用UTF-8格式保存,则在使用程序读取是会从文件中多读出一个不可见字符。
测试代码如下:
Java代码 复制代码
  1. import java.io.BufferedReader;
  2. import java.io.File;
  3. import java.io.FileInputStream;
  4. import java.io.IOException;
  5. import java.io.InputStreamReader;
  6. public class UTF8Test {
  7. public static void main(String[] args) throws IOException {
  8. File f = new File("./utf.txt");
  9. FileInputStream in = new FileInputStream(f);
  10. // 指定读取文件时以UTF-8的格式读取
  11. BufferedReader br = new BufferedReader(new InputStreamReader(in, "UTF-8"));
  12. String line = br.readLine();
  13. while(line != null)
  14. {
  15. System.out.println(line);
  16. line = br.readLine();
  17. }
  18. }
  19. }
  1. import java.io.BufferedReader;
  2. import java.io.File;
  3. import java.io.FileInputStream;
  4. import java.io.IOException;
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值