java文件读取的几种方式,中文乱码?还是 FileInputStream好用!

作为一个上层应用开发人员,研究这东西纯属浪费时间,但我比较爱钻牛角尖,不一探究竟,心里总有一个梗,于是花了一天时间,研究了下java.io
首先是拿文件做了N个实验:
windows下txt文件的每一行行尾都是’\r\n’
\r是回车,ASCII码值是13,英文是Carriage return,表示使光标下移一格
\n是换行,ASCII码值是10,英文是New line,表示使光标到行首

从文件读取的方法有很多种:
1.Scanner while(s.hasNextLine()) { String line = s.nextLine(); out(line); }

/**Scanner 逐行读文件,读取中文,乱码*/
	static void test_readFile_Scanner(File f) throws IOException {
		Scanner s = new Scanner(f);
		while(s.hasNextLine()) {
			out(s.nextLine());
		}
		s.close();
	}

输出结果

LaaaaaaaaL
鎴戝緢濂?
end

2.BufferedReader while((line = br.readLine())!=null) { out(line); }

/**BufferedReader逐行读文件,读取中文,乱码*/
	static void test_readFile_BufferedReader(File f) throws IOException {
		FileReader fr = new FileReader(f);
		BufferedReader br = new BufferedReader(fr);
		String line;
		while((line = br.readLine())!=null) {
			out(line);
		}
		br.close();
		fr.close();
	}
LaaaaaaaaL
鎴戝緢濂?
end

3.FileReader char[] cs = new char[1024]; fr.read(cs); out(String.valueOf(cs));

/**FileReader 逐行读文件,读取中文,乱码*/
	static void test_readFile_FileReader(File f) throws IOException {
		FileReader fr = new FileReader(f);
		char[] cs = new char[100];
		String line = "";
		fr.read(cs);
		for(char c : cs) {
			line = line + String.valueOf(c);
			if(c == '\n'){
				out("一行:%s", line);
				line = "";
				continue;
			}
		}
		out("一行:%s", line);// 最后一行没有换行符,所以在这里输出
		fr.close();
	}

每行文本本身带换行,所以输出会有空行

一行:LaaaaaaaaL

一行:鎴戝緢濂?

一行:end

4.FileInputStream
前面两种提供的按行读取,如果文件字符集编码与系统不一样,都不能处理中文编码乱码问题。
第三种可以按字符读取,但仍然存在中文乱码问题
第四种只能按照字节读取,所以需要自己处理字节信息,转换成想要的数据类型。
FileInputStream 提供了两种读取字节的方法
public int read() throws IOException { return read0(); }
private native int read0() throws IOException;
这种方法试一次读取一个字节,并转化成int返回。
private native int readBytes(byte b[], int off, int len) throws IOException;
这种:b[]读取的字节存放带此字节数组,off存放起点,一般从0开始存放,len,一次读取几个字节,返回读取的字节数,返回-1表示未读到数据。

于是我尝试了N种处理,最后才如愿以偿的将文本内容转化成需要的List,每行相当于一个String对象,添加到List中。
先看看效果
在这里插入图片描述
看代码:

/**FileInputStream 读取文件,每行作为一个String对象,返回List<String>*/
	public static List<String> readFile(File f) throws IOException {
		FileInputStream fi = new FileInputStream(f);
		int len = 0;// 每一次读取返回int类型(针对带参read,不带参read返回的是字节转化成int值),若等于-1,说明读到文件尾了
		byte[] bs = new byte[1];// 按一个字节读取,存放在这个字节数组,不同时读取多个,是因为要处理换行回车字节信息
		String line = "";// 每一行转化成String后
		List<String> lines = new ArrayList<>();// 最后返回
		
		int i=0;
		byte[] b_tmp = new byte[65535];// 每一行字节信息,长度可以大一些,不然会出现数组越界报错
		while((len=fi.read(bs,0,1))!=-1) {
			if(bs[0]==10) {
				continue;// '\n'信息不处理,跳过
			}
			b_tmp[i++] = bs[0];
			if(bs[0]==13) { // '\r'每遇到这个字节,说明一行结束了,保存本行字节信息,并转化成String
				b_tmp[i-1] = 0;// 将最后一位换行字符去除
				line = btos(b_tmp);// 自定义了一个转化方法,将定长字节数组转化成字符串,可以转化传给你中文
				lines.add(line);
				b_tmp = new byte[65535];// 需要初始化,不然影响后续行信息
				i = 0;// 临时byte数组从0开始存放
			}
		}
		line = btos(b_tmp);
		lines.add(line);
		
		fi.close();
		return lines;
	}

这里调用了一个字节数组转化成字符串的方法,这里有个String的构造函数,可以解决中文乱码的问题

/**字节数组转字符串,空字节去除*/
	public static String btos(byte[] b) throws IOException {
		int len = 0;
		for(int i=0;i<b.length;i++) {
			if(b[i]==0) {
				len = i;
				break;
			}
		}
		return new String(b, 0, len, "UTF-8");// 解决中文乱码最重要的环节
	}

到这里基本就完成文件的简单读取操作了,后续需要将文件内容进行分割、反射到对象的属性,可以在此基础上进行进一步封装。

后续有空,再研究下文件写操作 ^ _ ^

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值