海量小文件备份指南

海量小文件以其目录深且广、文件量大等特点,带来了扫描速度慢、小文件多导致网络交互高、传输效率低备份时间耗时长等痛点。要想解决好海量小文件备份场景,从文件级出发可以通过以下方式提高效率:

  1. 采用高效扫描算法,综合目录广度和深度的自适应扫描算法;
  2. 采用多线程,多线程扫描文件和目录+多线程传输数据;
  3. 采用生产者消费者模型,让扫描和传输同时进行;
  4. 传输时将小文件打包成大文件再进行传输,降低网络交互;
  5. 数据合并存储,降低存储数据所需要的时间;
  6. 通过对源文件多个维度提取关键信息,构建文件指纹,结合高效算法,快速与关联备份集进行对比,快速提取出增量信息。
  7. 备份系统采用多节点部署,将文件目录划分节点进行备份,横向扩展提高备份速度。

以下为系统模拟海量小文件场景实验的相关数据信息:

  1. 实验拓扑图,如下图:

     2.实验环境参数,如下图:

    3.实验所用的数据,如下图:


第一层目录下:有10个目录,每个目录下结构一致;

第一层目录下:第二层到第七层,每个目录下都有六个目录;

第八层目录下:每个目录下都有三十六个10KB的文件。

 4.完全备份实验结果:


5.增量备份实验数据:

6.增量备份实验结果:

  • 8
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值