Java高效读取大文件

最新推荐文章于 2024-09-13 14:30:27 发布

攻城狮--晴明

最新推荐文章于 2024-09-13 14:30:27 发布

阅读量5.4k

点赞数 3

分类专栏： Java 文章标签： java

本文链接：https://blog.csdn.net/qq_37267015/article/details/78636458

版权

本文探讨了如何使用Java高效地读取大文件，避免内存溢出。通过对比内存中读取、文件流和Apache Commons IO流的方式，强调了行迭代的重要性。使用Scanner和LineIterator可以实现逐行读取，减少内存消耗。

摘要由CSDN通过智能技术生成

1、概述

本教程将演示如何用Java高效地读取大文件。

2、在内存中读取

读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：

Files.readLines(new File(path), Charsets.UTF_8);
 
FileUtils.readLines(new File(path));

这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致程序抛出OutOfMemoryError 异常。

例如：读取一个大约1G的文件：

@Test
public void givenUsingGuava_whenIteratingAFile_thenWorks() throws IOException {
    
    String path = ...
    Files.readLines(new File(path), Charsets.UTF_8);
}

这种方式开始时只占用很少的内存：（大约消耗了0Mb内存）

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

攻城狮--晴明

关注关注

3
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

java从文件中读取数据的几种方法（Java io基础），GitHub标星1w的Java架构师必备技能

2401_83977530的博客

04-04

1243

对于面试还是要好好准备的，尤其是有些问题还是很容易挖坑的，例如你为什么离开现在的公司（你当然不应该抱怨现在的公司有哪些不好的地方，更多的应该表明自己想要寻找更好的发展机会，自己的一些现实因素，比如对于我而言是现在应聘的公司离自己的家更近，又或者是自己工作到达了迷茫期，想跳出迷茫期等等）Java面试精选题、架构实战文档你的支持，我的动力；祝各位前程似锦，offer不断！一个人可以走的很快，但一群人才能走的更远。如果你从事以下工作或对以下感兴趣，欢迎戳这里加入程序员的圈子，让我们一起学习成长！

Java读取大文件的高效率实现

jackesy的专栏

01-27

6651

1、在内存中读取 读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法： Files.readLines(new File(path), Charsets.UTF_8); FileUtils.readLines(new File(path)); 这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大

参与评论您还未登录，请先登录后发表或查看评论

java readall_【Java】Files.readAllBytes(Path) 遇见的坑

weixin_42444815的博客

02-16

1046

Files.readAllBytes(Path)方法把整个文件读入内存，此方法返回一个字节数组，还可以把结果传递给String的构造器，以便创建字符串输出。在针对大文件的读取的时候，可能会出现内存不足，导致堆溢出。最后还是采用原始的IO方式去读写文件，将文件读入byt数组中InputStream input = null;byte[] byt = null;try {File file = loc...

读取大文件

最新发布

docuxu的博客

09-13

477

当你需要使用 Java 读取一个非常大的文件（例如 5TB）并且系统内存只有 4GB 时，直接将整个文件加载到内存中是不可能的。需要采取一种分块读取的方式来处理这个大文件。

java大文件读取拆分（30G以上）

rocrunwang的博客

04-08

5542

java大文件读取拆分，本次示例解析拆分40G大小的SQL文件，解析过程50万行数据一个文件，具体逻辑直接上代码test1是单文件读取过滤，test2是文件拆分代码可以直接运行，只需修改：fileName(需要操作的目标文件路径)，outDir(拆分后文件输出目录)，outFile（单文件过滤后的输出路径）代码如下： package org.example; import org.junit.jupiter.api.Test; import java.io.BufferedInputS...

Java 大文件压缩

吃西瓜不吐葡萄皮

02-24

1235

装逼网址压缩效率 win10 下4.3G文件压缩实际耗时将近3分钟，160M文件压缩 8s。代码引入 commons-compress 坐标 <dependency> <groupId>org.apache.commons</groupId> <artifactId>commons-compress</artifactId> <version>1.20</version> </

Java高效读取大文件实例分析

08-28

Java 高效读取大文件实例分析在 Java 中高效读取大文件是一个非常重要的知识点，特别是在处理大规模数据的时候。今天，我们将讨论如何高效地读取大文件，避免出现OutOfMemoryError 异常。概述 ----- 在 Java 中...

JAVA高效读取大文件[参考].pdf

10-19

"JAVA高效读取大文件" 概述：本文将讨论如何使用 Java 高效地读取大文件，解决读取大文件时可能遇到的 OutOfMemoryError 异常问题。同时，文章还将介绍使用 Guava 和 Apache Commons IO 库来读取大文件的不同方法，...

java使用多线程读取超大文件

08-25

Java使用多线程读取超大文件 Java使用多线程读取超大文件是指在java语言中使用多线程技术来读取超大文件，以提高读取速度和效率。下面是该技术的详细介绍和实现方法。多线程读取超大文件的必要性在读取超大文件...

完美解决java读取大文件内存溢出的问题

08-29

下面小编就为大家带来一篇完美解决java读取大文件内存溢出的问题。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧

FileUtils API

xiatianba的专栏

06-05

254

转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好...

解决大文件的OOM的问题

徐小冠

02-14

9040

下面就为大家带来一篇完美解决java读取大文件内存溢出的问题。本人觉得挺不错的，现在就分享给大家，也给大家做个参考。一、传统方式 1、在内存中读取文件内容 读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法： Files.readLines(new File(path), Charsets.UTF_8); FileUtil...

9hutool实战 FileUtil 文件工具类(读取文件)_cn(1)，2024年最新大数据开发面试项目上的难点

2401_84170190的博客

04-16

1223

Java实践：高效率读取文件流

孔乙己大叔的博客

09-13

916

在Java开发中，文件处理是一项基础而重要的任务。无论是处理日志文件、配置文件还是用户上传的数据文件，高效的文件读取机制都是必不可少的。在众多文件读取方式中，使用结合FileReader被普遍认为是读取文本文件最高效的方法之一。本文将深入探讨这一组合的优势、实现细节，并通过丰富的代码示例来展示如何在实际应用中使用它们。

java文件流下载大文件内存溢出

greenhandp的博客

02-23

7169

java下载大文件内存溢出 OOM解决方案

java 处理byte_java - 文件到Java中的byte [] - 堆栈内存溢出

weixin_39980893的博客

02-16

1557

===============>>#1 票数：1222例：import java.io.File;import java.nio.file.Files;File file;// ...(file is initialised)...byte[] fileContent = Files.readAllBytes(file.toPath());===============>>...

使用java读取大文本文件（2G）

yuwenruli的专栏

10-28

3583

最忌服务器不稳定一直出现各种问题，莫名其妙的出现404,500的等错误，并且时好时坏。只有分析web 服务器的日志，上去一看，我滴个神呢~~~2G。工具各种尝试，各种卡死，各种缓慢。折腾半天，，没辙~~ 只好使用java写个读取的吧，开始打算使用commons-io来读取，一运行，OOM了。看来只能使用一点点读取了，写了下面的代码。居然可以了。 public class An