作为一个上层应用开发人员,研究这东西纯属浪费时间,但我比较爱钻牛角尖,不一探究竟,心里总有一个梗,于是花了一天时间,研究了下java.io
首先是拿文件做了N个实验:
windows下txt文件的每一行行尾都是’\r\n’
\r是回车,ASCII码值是13,英文是Carriage return,表示使光标下移一格
\n是换行,ASCII码值是10,英文是New line,表示使光标到行首
从文件读取的方法有很多种:
1.Scanner while(s.hasNextLine()) { String line = s.nextLine(); out(line); }
/**Scanner 逐行读文件,读取中文,乱码*/
static void test_readFile_Scanner(File f) throws IOException {
Scanner s = new Scanner(f);
while(s.hasNextLine()) {
out(s.nextLine());
}
s.close();
}
输出结果
LaaaaaaaaL
鎴戝緢濂?
end
2.BufferedReader while((line = br.readLine())!=null) { out(line); }
/**BufferedReader逐行读文件,读取中文,乱码*/
static void test_readFile_BufferedReader(File f) throws IOException {
FileReader fr = new FileReader(f);
BufferedReader br = new BufferedReader(fr);
String line;
while((line = br.readLine())!=null) {
out(line);
}
br.close();
fr.close();
}
LaaaaaaaaL
鎴戝緢濂?
end
3.FileReader char[] cs = new char[1024]; fr.read(cs); out(String.valueOf(cs));
/**FileReader 逐行读文件,读取中文,乱码*/
static void test_readFile_FileReader(File f) throws IOException {
FileReader fr = new FileReader(f);
char[] cs = new char[100];
String line = "";
fr.read(cs);
for(char c : cs) {
line = line + String.valueOf(c);
if(c == '\n'){
out("一行:%s", line);
line = "";
continue;
}
}
out("一行:%s", line);// 最后一行没有换行符,所以在这里输出
fr.close();
}
每行文本本身带换行,所以输出会有空行
一行:LaaaaaaaaL
一行:鎴戝緢濂?
一行:end
4.FileInputStream
前面两种提供的按行读取,如果文件字符集编码与系统不一样,都不能处理中文编码乱码问题。
第三种可以按字符读取,但仍然存在中文乱码问题
第四种只能按照字节读取,所以需要自己处理字节信息,转换成想要的数据类型。
FileInputStream 提供了两种读取字节的方法
public int read() throws IOException { return read0(); }
private native int read0() throws IOException;
这种方法试一次读取一个字节,并转化成int返回。
private native int readBytes(byte b[], int off, int len) throws IOException;
这种:b[]读取的字节存放带此字节数组,off存放起点,一般从0开始存放,len,一次读取几个字节,返回读取的字节数,返回-1表示未读到数据。
于是我尝试了N种处理,最后才如愿以偿的将文本内容转化成需要的List,每行相当于一个String对象,添加到List中。
先看看效果
看代码:
/**FileInputStream 读取文件,每行作为一个String对象,返回List<String>*/
public static List<String> readFile(File f) throws IOException {
FileInputStream fi = new FileInputStream(f);
int len = 0;// 每一次读取返回int类型(针对带参read,不带参read返回的是字节转化成int值),若等于-1,说明读到文件尾了
byte[] bs = new byte[1];// 按一个字节读取,存放在这个字节数组,不同时读取多个,是因为要处理换行回车字节信息
String line = "";// 每一行转化成String后
List<String> lines = new ArrayList<>();// 最后返回
int i=0;
byte[] b_tmp = new byte[65535];// 每一行字节信息,长度可以大一些,不然会出现数组越界报错
while((len=fi.read(bs,0,1))!=-1) {
if(bs[0]==10) {
continue;// '\n'信息不处理,跳过
}
b_tmp[i++] = bs[0];
if(bs[0]==13) { // '\r'每遇到这个字节,说明一行结束了,保存本行字节信息,并转化成String
b_tmp[i-1] = 0;// 将最后一位换行字符去除
line = btos(b_tmp);// 自定义了一个转化方法,将定长字节数组转化成字符串,可以转化传给你中文
lines.add(line);
b_tmp = new byte[65535];// 需要初始化,不然影响后续行信息
i = 0;// 临时byte数组从0开始存放
}
}
line = btos(b_tmp);
lines.add(line);
fi.close();
return lines;
}
这里调用了一个字节数组转化成字符串的方法,这里有个String的构造函数,可以解决中文乱码的问题
/**字节数组转字符串,空字节去除*/
public static String btos(byte[] b) throws IOException {
int len = 0;
for(int i=0;i<b.length;i++) {
if(b[i]==0) {
len = i;
break;
}
}
return new String(b, 0, len, "UTF-8");// 解决中文乱码最重要的环节
}
到这里基本就完成文件的简单读取操作了,后续需要将文件内容进行分割、反射到对象的属性,可以在此基础上进行进一步封装。
后续有空,再研究下文件写操作 ^ _ ^