linux下分卷压缩、合并解压的3种方法

    工作时编写CGI程序实现文件上传,遇到上传大小1M的限制,虽然后来通过修改boa服务器源码解决这一限制(解除boa服务器对上传的单个文件大小的限制https://blog.csdn.net/Brouce__Lee/article/details/81009746),但是中途了解了关于Linux下分卷压缩、合并解压的相关知识,觉得蛮有意思。以下为我找到的比较不错的博客,关键地方我已加黑,以作分享和学习。谢谢博主海底苍鹰。

作者:海底苍鹰
地址:http://blog.51yip.com/linux/988.html


 博客正文


    我们上传东西的时候,由于文件过大而不能上传,或者不给上传,最明显的就是发邮件了,附件最大5M,有的10M。如果超过了就郁闷了。这个时候,如果能把压缩的东西,分割开来就比较爽了,windows下面我想大家知道怎么分割,利用winrar,winzip图型化设置压缩出来的块的大小。但是在linux下面有没有这样的方法了,linux下面有rar命令,有zip命令,windows下面这二种方式可以分割压缩,我想linux下面绝对也是可以的。下面是我尝试过程的记录:

一,rar分卷压缩和合并解压

rar -h

我们会发现以下参数,要创建多大的卷。

v             Create volumes with size autodetection or list all volumes
v<size>[k,b]  Create volumes with size=<size>*1000 [*1024, *1]

实现过程

  1. [zhangy@BlackGhost awksed]$ rar a -v5m google.rar Google_Maps_API.doc  //-v和5m之间不要有空格  
  2.   
  3. RAR 3.92   Copyright (c) 1993-2010 Alexander Roshal   10 Feb 2010  
  4. Shareware version         Type RAR -? for help  
  5.   
  6. Evaluation copy. Please register.  
  7.   
  8. Creating archive google.rar  
  9.   
  10. Adding    Google_Maps_API.doc  
  11. Calculating the control sum       
  12.   
  13. Creating archive google.part2.rar  
  14.   
  15. ...       Google_Maps_API.doc  
  16. Calculating the control sum       
  17.   
  18. Creating archive google.part3.rar  
  19.   
  20. ...       Google_Maps_API.doc                                         OK  
  21. Calculating the control sum  
  22. Done  
  23. [zhangy@BlackGhost awksed]$ unrar x google.part1.rar //合并并解压  
  24.   
  25. UNRAR 3.90 freeware      Copyright (c) 1993-2009 Alexander Roshal  
  26.   
  27. Extracting from google.part1.rar  
  28.   
  29. Extracting  Google_Maps_API.doc                                            
  30.   
  31. Extracting from google.part2.rar  
  32.   
  33. ...         Google_Maps_API.doc                                       76%  
  34.   
  35. Extracting from google.part3.rar  
  36.   
  37. ...         Google_Maps_API.doc                                       OK  
  38. All OK  

二,zip分卷压缩和合并解压

zip -h2

你会发现,分卷参数-s,意思是说分割成多大的卷

Splits (archives created as a set of split files):
-s ssize  create split archive with splits of size ssize, where ssize nm
n number and m multiplier (kmgt, default m), 100k -> 100 kB

下面的意思是说如果是分卷的了,用 -s 0 --out把分卷合成一个

If input is split, output will default to same split size
Use -s=0 or -s- to turn off splitting to convert split to single file:
zip in_split_archive -s 0 --out out_single_file_archive

用zip来分卷压缩时,他必须是.zip的形势,他的流程是这样的,先把一般文件压缩成.zip的文件,然后在将.zip的文件分成多少块,如果你不这样坐呢,会提示错误的。

[zhangy@BlackGhost awksed]$ zip -s 4m Google_Maps_API.doc
zip error: Invalid command arguments (archive name must end in .zip for splits)

实现过程

  1. [zhangy@BlackGhost awksed]$ zip google.zip Google_Maps_API.doc //先压缩不然就报上面的错  
  2.   adding: Google_Maps_API.doc(deflated 12%)  
  3. [zhangy@BlackGhost awksed]$ zip -s 4m google.zip --out ziptest   //分卷  
  4.  copying: Google_Maps_API.doc  
  5. [zhangy@BlackGhost awksed]$ zip ziptest -s 0 --out google_bak.zip  //这样合卷有问题  
  6. copying: Google_Maps_API.doc  
  7. [zhangy@BlackGhost awksed]$ cat ziptest.z* > google_bak.zip //利用cat来合卷  
  8. [zhangy@BlackGhost awksed]$ unzip google_bak.zip  //解压  

上面呢用zip来分卷是没有问题的,但是合卷的时候就有问题了,zip -s 0 --out这样的方式,合出来的卷,大约只有分卷前的一半,这就搞的我很无语了,并且解压的时候,提示我输入密码,在次无语,只好有cat来合并了,还好合并后,解压没有任何问题。

三,利用split来分卷,cat来合并分卷

我花了很长时间去研究tar的参数,研究了好长时间,还是没有找到可以分卷的参数,英语还是不过关啊,唉。不过我们可以借助split来分卷

  1. [zhangy@BlackGhost awksed]$ tar czvf google.tar.gz Google_Maps_API.doc  
  2. Google_Maps_API.doc  
  3. [zhangy@BlackGhost awksed]$ split -d -b 4m google.tar.gz  
  4. [zhangy@BlackGhost awksed]$ cat x* > google_bak.tar.gz  
  5. [zhangy@BlackGhost awksed]$ tar zxvf google_bak.tar.gz  
  6. Google_Maps_API.doc  

分卷压缩

分卷压缩

上图说明

1,google.part1.rar等,是rar分卷压缩后的结果

2,x00,x01等是利用split来分卷后的结果

3,ziptest.zip,ziptest.z01等是利用zip来分卷后的结果。

我始终相信tar 可以直接进行分卷的。只不过我没有找到而已,下面是tar的参数,含有翻译

  1.  主操作模式:  
  2.   
  3.  -A, --catenate, --concatenate   追加 tar 文件至归档  
  4.  -c, --create               创建一个新归档  
  5.  -d, --diff, --compare      找出归档和文件系统的差异  
  6.  --delete               从归档(非磁带!)中删除  
  7.  -r, --append               追加文件至归档结尾  
  8.  -t, --list                 列出归档内容  
  9.  --test-label           测试归档卷标并退出  
  10.  -u, --update               仅追加比归档中副本更新的文件  
  11.  -x, --extract, --get       从归档中解出文件  
  12.   
  13.  操作修饰符:  
  14.  --check-device         当创建增量归档时检查设备号(默认)  
  15.  -g, --listed-incremental=文件处理新式的 GNU 格式的增量备份  
  16.  -G, --incremental          处理老式的 GNU 格式的增量备份  
  17.  --ignore-failed-read当遇上不可读文件时不要以非零值退出  
  18.  -n, --seek                 归档可检索  
  19.  --no-check-device      当创建增量归档时不要检查设备号  
  20.  --occurrence[=NUMBER]  仅处理归档中每个文件的第 NUMBER个事件;仅当与以下子命令 --delete,  
  21.  --diff, --extract 或是 --list中的一个联合使用时,此选项才有效。而且不管文件列表是以命令行形式给出或是通过  
  22.  -T 选项指定的;NUMBER 值默认为 1  
  23.  --sparse-version=MAJOR[.MINOR]设置所用的离散格式版本(隐含--sparse)  
  24.  -S, --sparse               高效处理离散文件  
  25.   
  26.  重写控制:  
  27.   
  28.  -k, --keep-old-files       解压时不要替换存在的文件  
  29.  --keep-newer-files不要替换比归档中副本更新的已存在的文件  
  30.  --no-overwrite-dir     保留已存在目录的元数据  
  31.  --overwrite            解压时重写存在的文件  
  32.  --overwrite-dir解压时重写已存在目录的元数据(默认)  
  33.  --recursive-unlink     解压目录之前先清除目录层次  
  34.  --remove-files         在添加文件至归档后删除它们  
  35.  -U, --unlink-first         在解压要重写的文件之前先删除它们  
  36.  -W, --verify               在写入以后尝试校验归档  
  37.   
  38.  选择输出流:  
  39.   
  40.  --ignore-command-error 忽略子进程的退出代码  
  41.  --no-ignore-command-error将子进程的非零退出代码认为发生错误  
  42.  -O, --to-stdout            解压文件至标准输出  
  43.  --to-command=COMMAND将解压的文件通过管道传送至另一个程序  
  44.  操作文件属性:  
  45.   
  46.  --atime-preserve[=METHOD]在输出的文件上保留访问时间,要么通过在读取(默认  
  47.  METHOD=‘replace’)后还原时间,要不就不要在第一次(METHOD=‘system’)设置时间  
  48.  --delay-directory-restore 直到解压结束才设置修改时间和所解目录的权限  
  49.  --group=名称         强制将 NAME作为所添加的文件的组所有者  
  50.  --mode=CHANGES         强制将所添加的文件(符号)更改为权限CHANGES  
  51.  --mtime=DATE-OR-FILE   从 DATE-OR-FILE 中为添加的文件设置mtime  
  52.  -m, --touch                不要解压文件的修改时间  
  53.  --no-delay-directory-restore取消 --delay-directory-restore 选项的效果  
  54.  --no-same-owner        将文件解压为您所有  
  55.  --no-same-permissions从归档中解压权限时使用用户的掩码位(默认为普通用户服务)  
  56.  --numeric-owner        总是以数字代表用户/组的名称  
  57.  --owner=名称         强制将 NAME作为所添加的文件的所有者  
  58.  -p, --preserve-permissions, --same-permissions解压文件权限信息(默认只为超级用户服务)  
  59.  --preserve             与 -p 和 -s 一样  
  60.  --same-owner           尝试解压时保持所有者关系一致  
  61.  -s, --preserve-order, --same-order为解压至匹配归档排序名称  
  62.   
  63.  设备选择和切换:  
  64.   
  65.  -f, --file=ARCHIVE         使用归档文件或 ARCHIVE 设备  
  66.  --force-local即使归档文件存在副本还是把它认为是本地归档  
  67.  -F, --info-script=名称, --new-volume-script=名称在每卷磁带最后运行脚本(隐含 -M)  
  68.  -L, --tape-length=NUMBER   写入 NUMBER × 1024 字节后更换磁带  
  69.  -M, --multi-volume         创建/列出/解压多卷归档文件  
  70.  --rmt-command=COMMAND  使用指定的 rmt COMMAND 代替 rmt  
  71.  --rsh-command=COMMAND  使用远程 COMMAND 代替 rsh  
  72.  --volno-file=文件    使用/更新 FILE 中的卷数  
  73.   
  74.  设备分块:  
  75.   
  76.  -b, --blocking-factor=BLOCKS   每个记录 BLOCKS x 512 字节  
  77.  -B, --read-full-records    读取时重新分块(只对 4.2BSD 管道有效)  
  78.  -i, --ignore-zeros         忽略归档中的零字节块(即文件结尾)  
  79.  --record-size=NUMBER   每个记录的字节数 NUMBER,乘以 512  
  80.   
  81.  选择归档格式:  
  82.   
  83.  -H, --format=FORMAT        创建指定格式的归档  
  84.   
  85.  FORMAT 是以下格式中的一种:  
  86.   
  87.  gnu                      GNU tar 1.13.x 格式  
  88.  oldgnu                   GNU 格式 as per tar <= 1.12  
  89.  pax                      POSIX 1003.1-2001 (pax) 格式  
  90.  posix                    等同于 pax  
  91.  ustar                    POSIX 1003.1-1988 (ustar) 格式  
  92.  v7                       old V7 tar 格式  
  93.   
  94.  --old-archive, --portability等同于 --format=v7  
  95.  --pax-option=关键字[[:]=值][,关键字[[:]=值]]...控制 pax 关键字  
  96.  --posix                等同于 --format=posix  
  97.  -V, --label=TEXT           创建带有卷名 TEXT的归档;在列出/解压时,使用 TEXT作为卷名的模式串  
  98.   
  99.  压缩选项:  
  100.   
  101.  -a, --auto-compress        使用归档后缀来决定压缩程序  
  102.  -I, --use-compress-program=PROG通过 PROG 过滤(必须是能接受 -d选项的程序)  
  103.  -j, --bzip2                通过 bzip2 过滤归档  
  104.  --lzma                 通过 lzma 过滤归档  
  105.  --no-auto-compress     do not use archive suffix to determine thecompression program  
  106.  -z, --gzip, --gunzip, --ungzip   通过 gzip 过滤归档  
  107.  -Z, --compress, --uncompress   通过 compress 过滤归档  
  108.   
  109.  -J, --xz                   filter the archive through xz  
  110.  --lzop                 通过 lzop 过滤归档  
  111.   
  112.  本地文件选择:  
  113.   
  114.  --add-file=文件      添加指定的 FILE 至归档(如果名字以 -开始会很有用的)  
  115.  --backup[=CONTROL]     在删除前备份,选择 CONTROL 版本  
  116.  -C, --directory=DIR        改变至目录 DIR  
  117.  --exclude=PATTERN      排除以 PATTERN 指定的文件  
  118.  --exclude-caches       除标识文件本身外,排除包含CACHEDIR.TAG 的目录中的内容  
  119.  --exclude-caches-all   排除包含 CACHEDIR.TAG 的目录  
  120.  --exclude-caches-under 排除包含 CACHEDIR.TAG的目录中所有内容  
  121.  --exclude-tag=文件   除 FILE 自身外,排除包含 FILE的目录中的内容  
  122.  --exclude-tag-all=文件   排除包含 FILE 的目录  
  123.  --exclude-tag-under=文件   排除包含 FILE的目录中的所有内容  
  124.  --exclude-vcs          排除版本控制系统目录  
  125.  -h, --dereference跟踪符号链接;将它们所指向的文件归档并输出  
  126.  --hard-dereference 跟踪硬链接;将它们所指向的文件归档并输出  
  127.  -K, --starting-file=MEMBER-NAME从归档中的 MEMBER-NAME 成员处开始  
  128.  --newer-mtime=DATE     当只有数据改变时比较数据和时间  
  129.  --no-null              禁用上一次的效果 --null 选项  
  130.  --no-recursion         避免目录中的自动降级  
  131.  --no-unquote           不以 -T 读取的文件名作为引用结束  
  132.  --null                 -T 读取以空终止的名字,-C 禁用  
  133.  -N, --newer=DATE-OR-FILE, --after-date=DATE-OR-FILE只保存比 DATE-OR-FILE 更新的文件  
  134.  --one-file-system      创建归档时保存在本地文件系统中  
  135.  -P, --absolute-names       不要从文件名中清除引导符‘/’  
  136.  --recursion            目录递归(默认)  
  137.  --suffix=STRING        在删除前备份,除非被环境变量SIMPLE_BACKUP_SUFFIX覆盖,否则覆盖常用后缀(‘’)  
  138.  -T, --files-from=文件    从 FILE中获取文件名来解压或创建文件  
  139.  --unquote              以 -T读取的文件名作为引用结束(默认)  
  140.  -X, --exclude-from=文件  排除 FILE 中列出的模式串  
  141.   
  142.  文件名变换:  
  143.   
  144.  --strip-components=NUMBER   解压时从文件名中清除 NUMBER个引导部分  
  145.  --transform=EXPRESSION, --xform=EXPRESSION使用 sed 代替 EXPRESSION 来进行文件名变换  
  146.   
  147.  文件名匹配选项(同时影响排除和包括模式串):  
  148.   
  149.  --anchored             模式串匹配文件名头部  
  150.  --ignore-case          忽略大小写  
  151.  --no-anchored          模式串匹配任意‘/’后字符(默认对  
  152.  exclusion 有效)  
  153.  --no-ignore-case       匹配大小写(默认)  
  154.  --no-wildcards         逐字匹配字符串  
  155.  --no-wildcards-match-slash   通配符不匹配‘/’  
  156.  --wildcards            使用通配符(默认对 exclusion )  
  157.  --wildcards-match-slash通配符匹配‘/’(默认对排除操作有效)  
  158.   
  159.  提示性输出:  
  160.   
  161.  --checkpoint[=NUMBER]  每隔 NUMBER个记录显示进度信息(默认为 10 个)  
  162.  --checkpoint-action=ACTION   在每个检查点上执行 ACTION  
  163.  --index-file=文件    将详细输出发送至 FILE  
  164.  -l, --check-links只要不是所有链接都被输出就打印信息  
  165.  --no-quote-chars=STRING   禁用来自 STRING 的字符引用  
  166.  --quote-chars=STRING   来自 STRING 的额外的引用字符  
  167.  --quoting-style=STYLE  设置名称引用风格;有效的 STYLE值请参阅以下说明  
  168.  -R, --block-number         每个信息都显示归档内的块数  
  169.  --show-defaults        显示 tar 默认选项  
  170.  --show-omitted-dir 列表或解压时,列出每个不匹配查找标准的目录  
  171.  --show-transformed-names, --show-stored-names显示变换后的文件名或归档名  
  172.  --totals[=SIGNAL]      处理归档后打印出总字节数;当此SIGNAL 被触发时带参数 -打印总字节数;允许的信号为:  
  173.  SIGHUP,SIGQUIT,SIGINT,SIGUSR1 和  
  174.  SIGUSR2;同时也接受不带 SIG  
  175.  前缀的信号名称  
  176.  --utc                  以 UTC 格式打印文件修改信息  
  177.  -v, --verbose              详细地列出处理的文件  
  178.  -w, --interactive, --confirmation每次操作都要求确认  
  179.   
  180.  兼容性选项:  
  181.   
  182.  -o                         创建归档时,相当于  
  183.  --old-archive;展开归档时,相当于  
  184.  --no-same-owner  
  185.   
  186.  其它选项:  
  187.   
  188.  -?, --help                 显示此帮助列表  
  189.  --restrict             禁用某些潜在的有危险的选项  
  190.  --usage                显示简短的用法说明  
  191.  --version              打印程序版本  
  192.   
  193. 长选项和相应短选项具有相同的强制参数或可选参数。  
  194.   
  195. 除非以 --suffix 或 SIMPLE_BACKUP_SUFFIX  
  196. 设置备份后缀,否则备份后缀就是“~”。  
  197. 可以用 --backup 或 VERSION_CONTROL 设置版本控制,可能的值为:  
  198.   
  199.  none, off       从不做备份  
  200.  t, numbered     进行编号备份  
  201.  nil, existing  
  202. 如果编号备份存在则进行编号备份,否则进行简单备份  
  203.  never, simple   总是使用简单备份 
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值