完美解决java读取大文件内存溢出的问题

最新推荐文章于 2024-06-01 18:13:44 发布

最是那一低头的温柔

最新推荐文章于 2024-06-01 18:13:44 发布

阅读量9.8k

点赞数 2

分类专栏：综合 Java对象之集合文章标签： big data java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HUXU981598436/article/details/121547293

版权

综合同时被 2 个专栏收录

117 篇文章 0 订阅

订阅专栏

Java对象之集合

29 篇文章 0 订阅

订阅专栏

1. 传统方式：在内存中读取文件内容

读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：

1 2	`Files.readLines(new File(path), Charsets.UTF_8);` `FileUtils.readLines(new File(path));`

实际上是使用BufferedReader或者其子类LineNumberReader来读取的。

传统方式的问题： 是文件的所有行都被存放在内存中，当文件足够大时很快就会导致程序抛出OutOfMemoryError 异常。

问题思考：我们通常不需要把文件的所有行一次性地放入内存中，相反，我们只需要遍历文件的每一行，然后做相应的处理，处理完之后把它扔掉。所以我们可以通过行迭代方式来读取，而不是把所有行都放在内存中。

2. 大文件读取处理方式

不重复读取与不耗尽内存的情况下处理大文件：

（1）文件流方式：使用java.util.Scanner类扫描文件的内容，一行一行连续地读取

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

FileInputStream inputStream = null;

Scanner sc = null;

try {

inputStream = new FileInputStream(path);

sc = new Scanner(inputStream, UTF-8);

while (sc.hasNextLine()) {

String line = sc.nextLine();

// System.out.println(line);

}

}catch(IOException e){

logger.error(e);

}finally {

if (inputStream != null) {

inputStream.close();

}

if (sc != null) {

sc.close();

}

}

该方案将会遍历文件中的所有行，允许对每一行进行处理，而不保持对它的引用。总之没有把它们存放在内存中！

（2）Apache Commons IO流：使用Commons IO库实现，利用该库提供的自定义LineIterator

1

2

3

4

5

6

7

8

9

LineIterator it = FileUtils.lineIterator(theFile, UTF-8);

try {

while (it.hasNext()) {

String line = it.nextLine();

// do something with line

}

} finally {

LineIterator.closeQuietly(it);

}

该方案由于整个文件不是全部存放在内存中，这也就导致相当保守的内存消耗。

最是那一低头的温柔

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
完美解决java读取大文件内存溢出的问题

1. 传统方式：在内存中读取文件内容读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法： 1 2 Files.readLines(new File(path), Charsets.UTF_8); FileUtils.readLines(new File(path)); 实际上是使用BufferedReader或者其子类LineNumberReader来读取的。传统方式的
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。