java存储数据,方便打印日志等
1、会覆盖以前的数据
try {
File writeName = new File("D:\data.txt"); // 相对路径,如果没有则要建立一个新的output.txt文件
if(!writeName.exists()) {
writeName.createNewFile(); // 创建新文件,有同名的文件的话直接覆盖
}
FileWriter writer = new FileWriter(writeName);
BufferedWriter out = new BufferedWriter(writer);
out.write(data);
out.flush(); // 把缓存区内容压入文件
out.close();
} catch (IOException e) {
e.printStackTrace();
}
2、接下一行存储,数据不覆盖
try {
File file = new File("D:\data.txt");
if(!file.exists()) {
file.createNewFile(); // 创建新文件,有同名的文件的话直接覆盖
}
FileOutputStream fos = new FileOutputStream(file,true);
OutputStreamWriter osw = new OutputStreamWriter(fos);
BufferedWriter bw = new BufferedWriter(osw);
bw.write(data);
bw.newLine();
bw.flush();
bw.close();
osw.close();
fos.close();
}catch (FileNotFoundException e1) {
e1.printStackTrace();
} catch (IOException e2) {
e2.printStackTrace();
}
从txt文件中读取数据:
JDK8,你可以这样,按行读取:
Path path = Paths.get("D:/aa.txt");
List<String> lines = Files.readLines(path);
JDK8,你可以这样,读取全部:
Path path = Paths.get("D:/aa.txt");
byte[] data = Files.readAllBytes(path);
String result = new String(data, "utf-8");
对于JDK11及以上版本,读取文本文件异常简单,我们只需要这样:
Path path = Paths.get("D:/aa.txt");
String data = Files.readString(path);
System.out.println(data);
1.读取文件的乱码问题:
使用类库:Cpdetector。
请直接添加相关jar包或者使用maven导入。
CodepageDetectorProxy codepageDetectorProxy = CodepageDetectorProxy.getInstance();
codepageDetectorProxy.add(JChardetFacade.getInstance());
Charset charset = codepageDetectorProxy.detectCodepage(file.toURI().toURL());
最原始的方法:
java提供了一个FileInputStream,我们可以直接以文件路径构造这个流,也可以以文件对象构造他,如:FileInputStream fin = new FileInputStream("d:/aa.txt");
然后使用这个流就可以直接读取到文件了,但是这个时候读取到的内容是int类型的数值,所以需要进一步的处理,我们把fin外面包上一个InputStreamReader,就变成了这样:
InputStreamReader reader = new InputStreamReader(fin);
但是这一个reader读取文本并不是很方便,有一点要注意,在这一个reader的构造方法上面可以设定字符编码;接下来,使用这个reader构造BufferedReader,BufferedReader拥有一个名为readLine的方法,可以读取一整行的文本,作为字符串返回,因此用起来会比较方便。
BufferedReader buffReader = new BufferedReader(reader);
接下来就是借助循环来读取文件中的字符串了,然后,去做你想做的事情好了
import java.io*;
public class MainStart{
public static void main(String args[]){
String filePath = "D:/aa.txt";
FileInputStream fin = new FileInputStream(filePath);
InputStreamReader reader = new InputStreamReader(fin);
BufferedReader buffReader = new BufferedReader(reader);
String strTmp = "";
while((strTmp = buffReader.readLine())!=null){
System.out.println(strTmp);
}
buffReader.close();
}
}
二进制读取方式:
2.1 使用DataInputStream:
DataInputStream din = new DataInputStream(new FileInputStream(file));
byte[] data = new byte[1024];
while(din.read(data) > 0) {
// 处理数据
}
din.close();
2.2 使用RandomAccessFile
RandomAccessFile randomFile = new RandomAccessFile(file, "r");
byte[] data = new byte[1024];
while(randomFile.read(data) > 0) {
// 处理数据
}
randomFile.close();
2.3两者的区别
RandomAccessFile可以通过移动文件指针改变读取的位置,可以按照几种基本类型直接读取数据,可以跳过一定的字节,整体来看,文件就像一个大的二进制数组。而DataInputStream就是单纯的输入流。
3. 大量数据的处理思路:
3.1 借助ByteBuffer使用堆外内存,在不导致oom的情况且内存充足的情况下可以大量申请内存。
3.2 借助RandomAccessFile分块读取,记录读取的最后位置,处理完毕后继续读。或者多线程处理,拆分整个文件为多个大小相等的块,分入多个子线程进入线程池并发处理。
3.3 用BufferedReader和正则,匹配到特征数据后暂停,然后处理数据,然后继续读取。