关于大文件上传,压缩的java操作

文章讲述了在处理大文件压缩和SFTP上传时,如何避免使用ByteArrayOutputStream导致的堆内存溢出问题。提出了一种通过创建临时文件、分块处理和使用FileOutputStream的方法,以实现大文件的稳定上传,同时包含了文件下载的重试机制。
摘要由CSDN通过智能技术生成
1. 无论是压缩大文件,还是 文件上传sftp 如果用到 ByteArrayOutputStream ,需要注意下,会造成堆益出,这个时候我不是很建议调整服务器参数,因为你这个文件 可能还会更大 ,所以一劳永逸的解决办法如下代码,这种方式适合慢一点,但是能传上去就行。
先看一下主运行代码:
public static void main(String[] args) throws Exception {
    String path ="jxd";
    File pathDirectory = new File(path);
    pathDirectory.mkdir();//创建主路径
    
    String  tempOut =doFileMethod(path);
    File fileTmpDir = new File(tempOut);
    sftpUtil.sftp.put(new FileInputStream(fileTmpDir), "test.zip");//上传
    //删除临时文件
    FileUtils.deleteQuietly(fileTmpDir);
    FileUtils.deleteQuietly(pathDirectory);
}

public static String doFileMethod(String path) throws IOException {
    String tmpDir = path + File.separator + "20230712";
    File fileTmpDir = new File(tmpDir);
    fileTmpDir.mkdirs();
    File PathDirectory = new File(path);

    if(!PathDirectory.isDirectory()){
        //注意这段代码很重要 如果目录FileOutputStream 这段代码就会执行不了,他也不回主动给你创建
        //
        throw new FileNotFoundException(path +"没有目录");
    }
    FileOutputStream fileOutputStream= new FileOutputStream( path + File.separator + "zipTemp");
    ZipOutputStream zos = new ZipOutputStream(fileOutputStream);
    WritableByteChannel writableByteChannel= Channels.newChannel(zos);
    String str="你的url 集合json[]";
    byte[] buffer = new byte[10240];
    try {
        JSONArray jsonArray = JSONArray.parseArray(str);
        for (Object object : jsonArray) {
            Map<String, InputStream> map = new HashMap<>();
            JSONObject jsonObject = (JSONObject) object;
            String fileId = jsonObject.getString("fileId");
            String fileName = jsonObject.getString("fileName");
            String NewfileName = tmpDir + File.separator +fileName;
            String url="拼接Url 路径".concat(fileId);
            downloadFile(url, NewfileName, 0);
            compressByUrlFile(fileName, zos, buffer, NewfileName, writableByteChannel);
        }

    }catch (Exception e){
        System.out.println(e.getMessage());

    }finally {
        zos.close();
        fileOutputStream.close();
        writableByteChannel.close();
        FileUtils.deleteQuietly(fileTmpDir);
    }
    return path + File.separator + "zipTemp";
}

/**
 * 可以进行重试的文件下载
 * @param url
 * @param fileName
 * @param retryCount
 */
private static void downloadFile(String url, String fileName, Integer retryCount) throws Exception{
    try {
        InputStream in = new URL(url).openStream();
        FileUtils.writeByteArrayToFile(new File(fileName), IOUtils.toByteArray(in));
        IOUtils.closeQuietly(in);
    } catch (IOException e) {
        e.printStackTrace();
        if(retryCount < 3) {
            downloadFile(url, fileName, retryCount++);
        } else {
            throw e;
        }
    }
}
/**
 * 压缩文件方法
 *
 *
private static void compressByUrlFile(String fileName, ZipOutputStream zos, String NewfileName,WritableByteChannel writableByteChannel) {
int readLength = 0;     //每次读取出来的长度
int count = 0;
int BUFFER = 10240;

    ZipEntry zipEntry = null;
    File dirFile = new File(NewfileName);
    try {
        FileChannel fileChannel = new FileInputStream(dirFile).getChannel();
            zipEntry = new ZipEntry(fileName);
            zipEntry.setSize(dirFile.length());
            zipEntry.setTime(dirFile.lastModified());
            zos.putNextEntry(zipEntry);
            fileChannel.transferTo(0,dirFile.length(),writableByteChannel);
//这是另一种方法,也是网上最多的方法,因为我们是通过url 所以我们可以不转文件
//直接 获取InputStream 输入流
//URL url = new URL("你的url")
//URLConnection urlConnection = url.openConnection();
//urlConnection.setAllowUserInteraction(false);
//InputStream  iS=url.openStream();
//BufferedInputStream buf = new //BufferedInputStream(iS);
//while ((readLength = buf.read(buffer, 0, BUFFER)) != -1) {
//    zos.write(buffer, 0, readLength);
//}
//zos.flush();

    } catch (IOException e) {
        e.printStackTrace();
    }
}
程序测试可用,直接解压导入到工程就可以,bat文件跟shell文件是用于在window跟linux上直接执行的脚本 我把开发的配置文档附上: 1.程序为定时任务,任务执行时间在bin目录下的配置文件mergeFilleUtil.properties中配置,在配置文件中,TASK_PERIOD表示任务执行时间间隔,单位为妙,如一天的时间间隔配置是86400,TASK_BEGIN_HOUR表示任务开始的小时时间,比如9点,TASK_BEGIN_MINUTE表任务开始的分钟,比如30分。 2. 程序用log4j记录日志,日志分正常信息跟错误信息两个级别,日志文件存放在log4j文件夹下。考虑到文件很多,日志解压、移动文件每解压、移动1000个记录一次,合并、删除文件每合并、删除50000个记录一次, 3. 启动任务前需配置文件解压合并的路径,本程序需配置的路径如下: 1). PROVINCE_DIR:原始文件存放的路径,必须配置到省的上一级路径,比如存放安徽省的文件路径为E:\test\rootfile\anhui,那么文件的路径必须配置为E:\test\rootfile,否则不能正确显示合并结果; 2). UN_ZIP_PATH:存放解压后的文件的路径; 3). OUT_PATH:存放合并后的文件路径; 4). DONE_FILE_PATH:存放已经解压处理过的文件; 5). DELETE_PATH:配置程序运行结束后欲删除文件的路径,如想删除多个文件夹下的文件,路径之间用逗号隔开,勿加空格,比如:E:\test\rootfile,E:\test\unZip; 4. 注意事项: 本解压合并程序处理文件的逻辑如下: 程序每次解压都去PROVINCE_DIR文件下去解压,将解压后的文件存放到UN_ZIP_PATH下,之后程序启动合并程序合并UN_ZIP_PATH下文件,将合并后的文件按照省份名称存放到OUT_PATH,一个省一个文件。当解压合并结束后,程序将PROVINCE_DIR路径下的文件移动到DONE_FILE_PATH下,并且删除PROVINCE_DIR跟UN_ZIP_PATH下文件,这样保证程序每次运行PROVINCE_DIR文件夹下的文件跟UN_ZIP_PATH下的文件都是最新未处理过的,避免了不断判断文件历史记录所带来的大量时间消耗。 所以为了保证文件解压跟合并的正确性,必须配置好DELETE_PATH路径下的文件,否则合并后的结果是不准确的。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值