java 分批读取文件_Java分批读取文件

该博客介绍了如何使用Java的MappedByteBuffer通过RandomAccessFile以分批方式读取大文件。通过调整映射区域的位置和大小,实现了对文件不同部分的高效访问,提高了读取效率。
摘要由CSDN通过智能技术生成

package com.Java.io.test;

import java.io.File;

import java.io.RandomAccessFile;

import java.nio.MappedByteBuffer;

import java.nio.channels.FileChannel;

public class ReadBig {

public static String fff = "C://Documents and Settings//Administrator//桌面//工作//数据整合/tmp//loopclean_xab.txt";

public static void main1(long s,int denominator) throws Exception {

final int BUFFER_SIZE = 0x300000;// 缓冲区大小为3M

File f = new File(fff);

/**

*

* map(FileChannel.MapMode mode,long position, long size)

*

* mode - 根据是按只读、读取/写入或专用(写入时拷贝)来映射文件,分别为 FileChannel.MapMode 类中所定义的

* READ_ONLY、READ_WRITE 或 PRIVATE 之一

*

* position - 文件中的位置,映射区域从此位置开始;必须为非负数

*

* size - 要映射的区域大小;必须为非负数且不大于 Integer.MAX_VALUE

*

* 所以若想读取文件后半部分内容,如例子所写;若想读取文本后1/8内容,需要这样写map(FileChannel.MapMode.READ_ONLY,

* f.length()*7/8,f.length()/8)

*

* 想读取文件所有内容,需要这样写map(FileChannel.MapMode.READ_ONLY, 0,f.length())

*

*/

MappedByteBuffer inputBuffer = new RandomAccessFile(f, "r")

.getChannel().map(FileChannel.MapMode.READ_ONLY,

f.length()*s/denominator, f.length() / denominator

// f.length()*7/8,f.length()/8

);

byte[] dst = new byte[BUFFER_SIZE];// 每次读出3M的内容

long start = System.currentTimeMillis();

for (int offset = 0; offset < inputBuffer.capacity(); offset += BUFFER_SIZE) {

if (inputBuffer.capacity() - offset >= BUFFER_SIZE) {

for (int i = 0; i < BUFFER_SIZE; i++)

dst[i] = inputBuffer.get(offset + i);

} else {

for (int i = 0; i < inputBuffer.capacity() - offset; i++)

dst[i] = inputBuffer.get(offset + i);

}

int length = (inputBuffer.capacity() % BUFFER_SIZE == 0) ? BUFFER_SIZE

: inputBuffer.capacity() % BUFFER_SIZE;

System.out.println(new String(dst, 0, length));// new

// String(dst,0,length)这样可以取出缓存保存的字符串,可以对其进行操作

}

long end = System.currentTimeMillis();

System.out.println("读取文件文件内容花费:" + (end - start) + "毫秒");

}

public static void main(String[] args) {

try {

//读取文件从7/8开始,到结束也就是读取文件最后1/8

ReadBig.main1(7,8);

} catch (Exception e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

}

/**

MappedByteBufferinputBuffer = new RandomAccessFile(f, "r")

.getChannel().map(FileChannel.MapMode.READ_ONLY,

0, f.length() / 2

// f.length()*7/8,f.length()/8

);

重要就是红色那段(我们可以把它当做两个参数)

我们可以编写一个方法,然后在方法内传递两个参数读取文件的多少完全由这两个参数决定

Eg:

0, f.length() / 2:                  文件前半部分

f.length() / 2, f.length() / 2 文件后半部分

..

主要看你要把文件分成几部分,你可以在每次查询时获取你想要的那部分内容,我测试过了这样可以大大提高效率;

*/0b1331709591d260c1c78e86d0c51c18.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值