java文件读取的几种方式，中文乱码？还是 FileInputStream好用！_java inputstream 中文名提示找不到 not exist!-CSDN博客

本文链接：https://blog.csdn.net/white_Black_s/article/details/109705183

作为一个上层应用开发人员，研究这东西纯属浪费时间，但我比较爱钻牛角尖，不一探究竟，心里总有一个梗，于是花了一天时间，研究了下java.io
首先是拿文件做了N个实验：
windows下txt文件的每一行行尾都是’\r\n’
\r是回车，ASCII码值是13，英文是Carriage return，表示使光标下移一格
\n是换行，ASCII码值是10，英文是New line，表示使光标到行首

从文件读取的方法有很多种：
1.Scanner while(s.hasNextLine()) { String line = s.nextLine(); out(line); }

/**Scanner 逐行读文件,读取中文，乱码*/
	static void test_readFile_Scanner(File f) throws IOException {
		Scanner s = new Scanner(f);
		while(s.hasNextLine()) {
			out(s.nextLine());
		}
		s.close();
	}

输出结果

LaaaaaaaaL
鎴戝緢濂?
end

2.BufferedReader while((line = br.readLine())!=null) { out(line); }

/**BufferedReader逐行读文件,读取中文，乱码*/
	static void test_readFile_BufferedReader(File f) throws IOException {
		FileReader fr = new FileReader(f);
		BufferedReader br = new BufferedReader(fr);
		String line;
		while((line = br.readLine())!=null) {
			out(line);
		}
		br.close();
		fr.close();
	}

LaaaaaaaaL
鎴戝緢濂?
end

3.FileReader char[] cs = new char[1024]; fr.read(cs); out(String.valueOf(cs));

/**FileReader 逐行读文件,读取中文，乱码*/
	static void test_readFile_FileReader(File f) throws IOException {
		FileReader fr = new FileReader(f);
		char[] cs = new char[100];
		String line = "";
		fr.read(cs);
		for(char c : cs) {
			line = line + String.valueOf(c);
			if(c == '\n'){
				out("一行：%s", line);
				line = "";
				continue;
			}
		}
		out("一行：%s", line);// 最后一行没有换行符，所以在这里输出
		fr.close();
	}

每行文本本身带换行，所以输出会有空行

一行：LaaaaaaaaL

一行：鎴戝緢濂?

一行：end

4.FileInputStream
前面两种提供的按行读取，如果文件字符集编码与系统不一样，都不能处理中文编码乱码问题。
第三种可以按字符读取，但仍然存在中文乱码问题
第四种只能按照字节读取，所以需要自己处理字节信息，转换成想要的数据类型。
FileInputStream 提供了两种读取字节的方法
public int read() throws IOException { return read0(); }
private native int read0() throws IOException;
这种方法试一次读取一个字节，并转化成int返回。
private native int readBytes(byte b[], int off, int len) throws IOException;
这种：b[]读取的字节存放带此字节数组，off存放起点，一般从0开始存放，len，一次读取几个字节，返回读取的字节数，返回-1表示未读到数据。

于是我尝试了N种处理，最后才如愿以偿的将文本内容转化成需要的List，每行相当于一个String对象，添加到List中。
先看看效果
在这里插入图片描述
看代码：

/**FileInputStream 读取文件，每行作为一个String对象，返回List<String>*/
	public static List<String> readFile(File f) throws IOException {
		FileInputStream fi = new FileInputStream(f);
		int len = 0;// 每一次读取返回int类型（针对带参read，不带参read返回的是字节转化成int值），若等于-1，说明读到文件尾了
		byte[] bs = new byte[1];// 按一个字节读取，存放在这个字节数组，不同时读取多个，是因为要处理换行回车字节信息
		String line = "";// 每一行转化成String后
		List<String> lines = new ArrayList<>();// 最后返回
		
		int i=0;
		byte[] b_tmp = new byte[65535];// 每一行字节信息，长度可以大一些，不然会出现数组越界报错
		while((len=fi.read(bs,0,1))!=-1) {
			if(bs[0]==10) {
				continue;// '\n'信息不处理，跳过
			}
			b_tmp[i++] = bs[0];
			if(bs[0]==13) { // '\r'每遇到这个字节，说明一行结束了，保存本行字节信息，并转化成String
				b_tmp[i-1] = 0;// 将最后一位换行字符去除
				line = btos(b_tmp);// 自定义了一个转化方法，将定长字节数组转化成字符串，可以转化传给你中文
				lines.add(line);
				b_tmp = new byte[65535];// 需要初始化，不然影响后续行信息
				i = 0;// 临时byte数组从0开始存放
			}
		}
		line = btos(b_tmp);
		lines.add(line);
		
		fi.close();
		return lines;
	}

这里调用了一个字节数组转化成字符串的方法，这里有个String的构造函数，可以解决中文乱码的问题

/**字节数组转字符串，空字节去除*/
	public static String btos(byte[] b) throws IOException {
		int len = 0;
		for(int i=0;i<b.length;i++) {
			if(b[i]==0) {
				len = i;
				break;
			}
		}
		return new String(b, 0, len, "UTF-8");// 解决中文乱码最重要的环节
	}