Linux常用的压缩及解压缩命令如表2-5所示。
表2-5 Linux常用的压缩及解压缩命令说明
常用命令 | 简要中文说明 | 程序所在目录 |
gzip | 压缩成文件名为 .gz 的压缩文件(也可用 –d 选项变成解压) | /bin |
gunzip | 将 .gz 压缩文件解压(可用 gzip 加 –d 参数代替) | /bin |
tar | 打包为 .tar 的打包文件或解开(也可配合 –z 选项呼叫 gzip 进行 .gz 文件的压缩或解压) | /bin |
compress | 压缩成文件名为 .Z 的压缩文件(也可用 –d 选项变成解压) | /usr/bin |
uncompress | 将 .Z 压缩文件解压(可用 compress 加 –d 选项代替) | /usr/bin |
zip | 打包并压缩成文件名为 .zip 的文件(本身没有解压能力,一定要用 unzip 来解压才行) | /usr/bin |
unzip | 将 .zip 文件解压 | /usr/bin |
bzip2 | 压缩成文件名为 .bz2 的压缩文件(也可用 –d 选项变成解压) | /bin |
bunzip2 | 将 .bz2 压缩文件解压(可用 bzip2 加 –d 选项代替) | /bin |
gzip [-选项] [文件名]
压缩成文件名为 .gz 的压缩文件
如果您看到 .gz, .tar.gz 的文件,都是 gzip 程序压缩的杰作。
gzip 是 GNU 组织开发的一种压缩程序,跟 Windows 上的 ZIP 不太一样(稍后会介绍一个一样的)。
我们先介绍压缩的方法。当我们有一个文件叫做 big1.bmp,由于点阵图文件通常都很大,要用 gzip 压缩,命令要怎么下呢?
最简单的可以这样:
gzip big1.bmp
但是如果您希望它压出“最小的文件”,那么就加一个 -9 选项:
gzip -9 big1.bmp
当然,“最小的文件”的代价,就是花最久的时间压缩,如果您希望它在最快时间压缩好,而不计较压缩的比例,那就相反,加一个 -1 (注意,是数字,不是小写英文l)选项:
gzip -1 big1.bmp
而如果您没有加 -1也没有加 -9,它的默认相当于 -6。
另外常用的选项还有:
l -v 压缩过程当中显示进度。
l -r 将子目录中的文件全部压缩。
至于它还有解压缩的选项,我们刻意将它挪到下一个命令中gunzip 再说明。
练习:
(1)gzip所指定要压缩的文件名,可以用通配符吗?
(2)找一个大约三五个文件的子目录,将子目录压缩。
gunzip [-选项] [文件名.gz]
将 .gz 压缩文件解压
gunzip 命令与 gzip 命令相对,专门把 gzip 压缩的 .gz 文件解压缩。如果您有已经压缩过的文件,例如 big1.gz,这时就可以用解压缩:
gunzip big1.gz
这个命令也可以用 gzip 自己来完成,效果完全一样:
gzip -d big1.gz
其实在有些版本的Linux 上,gunzip是去调用 gzip,顺便帮您加上个 -d 选项罢了(用链接文件做的)!但是有些版本不是,是一个真的程序。不过无论 gunzip到底是一个实在的程序,还是仅是一个连接,都不重要了。因为 gzip 这个程序,本身可以负责压缩,也可以解压缩,一物两用。(不见得每种压缩和解压缩程序都是这样。)所以,如果您记得 -d 选项,就可以根本不用记 gunzip 这个命令了。
gunzip甚至还可以去解其他压缩程序如 Compress 或 ZIP 压缩出来的文件。不过我们不建议您这样做,这样会让您自己很乱。而且它自己也承认,用它来解 zip 的文件并不是每一种情形都能完成。所以既然如此,何必这样麻烦呢?哪一种工具就固定做什么用,不是比较有条理又好记吗?
gunzip 有几个选项较常使用:
l -f 当解压时如果遇到有同名的文件存在,就直接覆盖,不必再询问。
l -r 将子目录中的文件全部解压缩。
l -v 解压缩过程当中显示进度。
同样,这些选项也可以再加在 gzip -d 上,效果一样。
练习:
(1)如果您在练习 gzip 时压缩了整个子目录,现在再将它解压。
(2)您是否能查得出来系统中的 gunzip 是真正的程序,还是链接文件?
tar [-选项] [打包文件名] [文件]
打包为 .tar 的打包文件或解开
如果您真的认真试过 gzip,或者您有使用 DOS, Windows的 ARJ, ZIP 一类程序的经验的话,就会发觉 gzip 有一个致命的缺点:它仅能压缩一个文件。即使针对子目录压缩,它也是针对子目录里的个别文件压缩,并没有把它们压成紧紧的一“包”。
于是在 Linux上,这个打“包”的任务习惯由 tar 程序来代劳。请注意,tar 并不是压缩程序,因为它打包之后的大小跟原来一样大。所以它不是压缩程序,而是打包程序。而我们习惯上会先打包,产生一个 .tar 文件,再把这个包裹拿去压缩。.tar.gz 的文件名就是这么来的。
也有人觉的 .tar.gz 这样的名称太长了,其实浓缩为 .tgz,意思也是一样的。
tar 的选项高达53个。(您用 man tar看就知道了)但是实用上没有那么多,而且同样几个每天重复使用。因此我们直接举例:
tar -cf new1.tar my1*.doc
把所有 my1*.doc 的文件打包成一个 new1.tar文件。其中,-c 是产生新文件;-f 是输出到默认的设备,您可以把它当做一定要加的选项就好。
tar -rf new1.tar my2*.doc
new1.tar 是一个已经存在的打包文件了。我们再把 my2*.doc 的所有文件也打包进去。-r 是再增加文件的意思。
tar -uf new1.tar my18.doc
方才 my1*.doc 已经打包进去了,但是其中的 my18.doc 后来又做了更改,我们把新改过的文件再重新打包进去,-u 是更新的意思。
说到这里,如果您是用过 ARJ 程序的人可能会嫌它有点笨。因为 ARJ 程序类似上述3个过程,都只要用一个 a 选项就都可以操作了,不是吗?如果您没用过 ARJ,就继续往下看。
tar -tf new1.tar
列出来 new1.tar 中有哪些文件被打包在里面。-t 是列出的意思。这个选项很像 ARJ 程序的 l 选项。
tar -xf new1.tar
把 new1.tar打包文件中的全部文件解出来,-x 是解开。
tar -xf new1.tar my2*.doc
只把 new1.tar打包文件中的所有 my2*.doc 文件解出来,-x 是解开。这个选项很像 ARJ 程序的 x 选项。
您注意到了吗?它也与 ARJ 程序很像,自己就可以负责打包,也可以负责解开,无需另外一个解压的程序。而它与ARJ的差别再强调一次,就是没有压缩能力!
但是,我可以向 gzip 程序借!就像便利店虽然没有面包房,还是可以代卖面包!对消费者来说,还是一样的嘛。-z 选项就是这个秘密进货管道!
tar -zcf new1.tar.gz my1*.doc
请注意这道命令与方才一道类似命令的不同之处。第一,加了 z 选项,它会向 gzip 借用压缩能力;第二,注意产生出来的文件名是 new1.tar.gz,两个过程,一次完成!
如果您想配合 Compress 程序(后面会介绍),压缩出另一种 .tar.Z 文件,那么只要把 -z 选项改为 -Z 选项就可以。
tar -Zcf new1.tar.Z my1*.doc
最后,我们再加一个选项-v,就是打包兼压缩或者解压的过程。因此,您最常看到的解压手续就是这样了(因为 Linux 上最常见的软件包装文件就是 .tar.gz 文件了):
tar -zxvf onepackage.tar.gz
如果是 .tgz 的文件名也是一样的,因为性质一样,只是文件名简单一点而已:
tar -zxvf onepackage.tgz
这个 -zxvf 的选项几乎可以是固定的,值得您背下来的。而这种文件当初是怎么生成的呢?可能是这样(您也可以背起来,以后就方便自己制造 .tar.gz 文件了):
tar -zcvf onepackage.tar.gz *.*
或者
tar -zcvf onepackage.tgz *.*
练习:
(1)在Thiz Linux 的 /usr/share/pixmaps/backgrounds/space 里面有很多太空的照片,请您把它们打包成一个“太空包”。
(2)续上题,请您把它们打包再压缩,制成一个“太空压缩包”。
compress [-选项] [文件名]
压缩成文件名为 .Z 的压缩文件
compress 跟 gzip 很近似,是一个压缩兼解压缩工具。如果您看到 .Z 、.tar.Z 的文件,都是compress 程序压缩的杰作。
我们先介绍压缩的方法。假设我们有一个字形文件叫做 taipei24.pcf ,字形文件通常都很大,要用 compress 压缩,命令要怎么下呢?
最简单的是这样:
compress taipei24.pcf
它就会产生一个 taipei24.pcf.Z 的压缩文件。
另外常用的选项还有:
l -v 压缩过程当中显示进度和比例。
至于它还有解压缩的选项,我们刻意将它挪到下一个命令uncompress中再说明。
练习:
(1)用gzip 和用 compress 压缩同样一个文件,哪一种的压缩效果比较好?
(2)要把所有 a*.pcf 的文件经过 tar 命令打包,再经过 compress 压缩而变成一个 afont.tar.Z 的文件,需要哪些命令?
uncompress [-选项] [文件名.Z]
将 .Z 压缩文件解压
uncompress 命令与compress 命令相对,专门把 compress 压缩出的 .Z 文件解压缩。如果您有已经压缩过的文件,例如 one.Z,这时就可以用
uncompress one.Z
也可以用 compress 自己来完成,效果完全一样:
compress -d one.Z
目前大部分版本的Linux中,uncompress其实只是去调用 compress,顺便帮您加上个 -d 选项罢了(用链接文件做的),并不是一个真的程序。
由于 compress 这个程序本身可以负责压缩,也可以解压缩,一物两用。(不见得每种压缩和解压缩程序都是这样。)所以,如果您记得 -d 选项,那就可以根本不用记 uncompress命令了。
uncompress 一般会用到的选项大概就一个:
-v 解压缩过程当中显示进度。
同样,这些选项也可以再加在 compress -d 上,效果一样。
练习:
(1)假设现在我们有一个 one.tar.Z 文件,有人觉的它的格式太旧了,想把它改成 one.tar.gz 再给别人,您会替他下这些命令吗?
(2)您能否把一些文件压缩成 .tar.Z,再自行解开?
zip [-选项] [文件名.zip] [文件名]
打包并压缩成文件名为 .zip 的文件
zip与gzip虽然只差一个字母,但是用法差多了。
zip 所使用的格式其实与 DOS 和 Windows 上的 .zip 是完全一样的!也就是说,它无需经过打包和压缩两道手续,就可以产生兼有两种效用的“压缩文件包”。而且,如果使用这种格式的话,就可以和 .bmp, .jpg, .gif 等文件一样,自由地通行于 Windows 和 Linux 之间,多方便啊!例如,可以在 Windows中用WinZip 程序解开,或者用WinZip 压成 .zip 直接给 Linux 用。
既然这么好,为什么大家不常用它?不要问我,我也不知道。电脑的世界里常常存在一种怪现象,好的东西不见得大家都用,大家都在用的往往并不是最佳的选择,或者只是听前辈这样用,他就跟着这样用。
总之,如果您认为大家没在用的东西,就是不好的,那很可能是错。到最后,找人来分析为什么用某某那样东西?优点为何?“普遍”!居然也可成为优点之一,奇怪!
zip 打包兼压缩的命令像是这样下达的(它高达36个选项,但是相信下面这些应该够您用了):
zip new1.zip my1*.doc
把所有 my1*.doc 的文件打包成一个 new1.zip文件。new1.zip 可以省略扩展名简写成 new1,它会自行默认 .zip 的扩展名。
zip -d new1.zip my18.doc
如果当初my18.doc 是压缩在 new1.zip 中的一个文件,现在这条命令把它从压缩文件中抽走并删掉。-d 是删除的意思。
zip -g new1.zip my32.doc
如果当初并没有把 my32.doc 压在 new1.zip 里面,现在把它加进去。-g 选项是增加而不要重新产生的意思(grow,长大,这个字母用得比较特别一点)。
zip -u new1.zip my2*.doc
如果当初 my2*.doc都已经压缩进 new1.zip 里面了,但是后来 my2*.doc中有几个文件有更改,又不想去找出到底是哪些文件更改了,这条命令请系统自行帮助检查,更改过的才更新到压缩,否则就不必动。-u 是更新的意思。
zip -r new2.zip mydir
如果 mydir 是一个目录名称,它会把整个目录的所有文件压缩成一个 new2.zip 文件。-r 选项是压缩子目录的意思。
那么解压缩的选项呢?抱歉,zip只能压缩,没有兼职解压缩的功能。解压缩请用unzip。
练习:
(1)如果压缩了一个子目录,而现在子目录里有些文件更新了(但未改名),要怎么办?如果它更新了,也改名了(例如 my0730.doc 改为 my0731.doc),要怎么处理?
(2)请把 zip 压好的文件经过 mount 驱动器过程,把它复制到 Windows 的驱动器,然后用WinZip 程序解压试试看。最好是压缩一些 .bmp 或 .jpg 等文件,到了 Windows 还可以验证它是否还原了。
unzip [-选项] [文件名.zip] [文件名]
将 .zip 压缩文件解压
zip 和 unzip这组程序真正是一对搭档。zip 程序本身没有解压能力,一定要用unzip 程序来解压才行。unzip 是一个真正的程序,并不是 zip 的替身。
因为 zip 程序会把一大堆文件压缩在一起,而解压时,有可能这一大堆文件的其中一些已经存在了(如果都不存在,当然很简单),于是产生了一些错综复杂、纠葛缠绵的解 压情况,您要有心里准备!例如,我们要把这些已经存在的文件通通无条件地覆盖过去呢,还是只有把比它新才覆盖过去?或者无论新旧,只有不存在的文件才压缩 加上去,还是每次遇到已有文件存在时,都要询问我,由我来决定?所谓已经存在,是用 UNIX 的判别法则,还是 DOS 的判别法则?也就是说,如果压缩文件里有一个大写的MYFILE,它和现有的小写myfile算同名文件,还是算不同名文件?
还有,因为 zip可以把整个子目录压缩起来,那么解压缩的时候,又会遇到无可避免的抉择情况:您是要解压回与原来目录一样的位置,还是在现有目录上解压并产生目录?
因为上面情况太复杂了,所以我们只列一道范例命令,然后其他都直接列出选项了:
unzip onepackage.zip a*.doc
把 onepackage.zip 里面凡是 a*.doc 的都解压出来。如果 a*.doc文件名没有输入,就会把onepackage.zip 全部解压。但是最好配合下面的选项,决定您遇到现有相同文件名时的8个处理决策:
-f 只解压更新已存在的文件,其他文件不解压(但更新时会一一询问)。
-u 解压更新已存在的文件,并把不存在的文件也解压(但更新时会一一询问)。
-fo 只解压更新已存在的文件,其他文件不解压(但不询问直接覆盖更新)。
-uo 解压更新已存在的文件,并把不存在的文件也解压(但不询问直接覆盖更新)。
-o 不论文件是新是旧,一律从压缩文件中解压,并直接覆盖。
-n 只把不存在的文件解压,已存在的文件则无论新旧一律保留原状。
-C 不计较大小写的不同,视为相同文件名(默认是视为不同)。
-L 解压时一律将文件名转为小写。
还有,遇到有子目录时的处理决策:
-j 不管原来压缩时的目录为何,均全部解开于现行目录。
-d 后面接一个目录名称。可以指定解压到该目录。
一个其他的常用选项:
-l 只列出压缩包里面有哪些文件,而不真的解开压缩。
练习:
(1)从 Windows 磁盘里找一个或临时用 WinZip 制作一个 .zip 压缩文件,拿到 Linux 用 unzip 命令解开。有必要在解压时一律转为小写吗?
(2)如果我们在 Linux中压缩了两个大小写不同但字母相同的文件到 .zip,这个文件拿到Windows用 Winzip 程序解开时会怎样?
bzip2 [-选项] [文件名]
压缩成文件名为 .bz2 的压缩文件
bzip2 是新一代的压缩程序,但是仍然改不掉 gzip 的老毛病:只能压缩一个文件,要打包还得靠 tar帮忙。所以您还是会看到 tar.bz2 这种文件。
bzip2 引用的是一套称为Burrows-Wheeler block sorting的文字压缩演算法,以及有名的霍夫曼编码法(Huffman coding),所以名称为B字开头。这种压缩法在压缩的过程会用到称为block的内存单位,您可以自定义这个block内存单位的大小,block用 得越大,压缩的效果越好,当然用的内存就越多。我们可以给定1~9的选项,它所用的内存算法如下。
压缩时:
内存用量=400KB+(block 大小×7)
block 大小=选项×100KB
解压时:
内存用量=400KB+(block 大小×4)
解压时的block 大小已经在压缩时决定了,所以不用选项决定。所以,压缩时可以这样下达命令:
bzip2 -9 -k myfile.doc
把 myfile.doc 命令压缩成最小的文件,-9选项其实是默认的。它会产生myfile.doc.bz2 文件。加上 -k 选项表示虽然产生了 myfile.doc.bz2,但仍要保留 myfile.doc 原文件,这就是 gzip 程序所做不到的了。
练习:
(1)请找到一个 xxxxx.tar.gz 文件,把它改制成 xxxxx.tar.bz2 文件。
(2)bzip2是否也像 gzip 或 compress一样,可以用 -d 选项自兼解压缩的功能?
bunzip2 [-选项] [文件名.bz2]
将 .bz2 压缩文件解压
bunzip2 命令与 bzip 命令相对,专门把 bzip 压缩出的 .bz2 文件解压缩。如果您有已经压缩过的文件,例如 myfile.bz2,这时就可以用:
bunzip2 myfile.bz2
也可以用 bzip2 自己来完成,效果完全一样:
bzip2 -d myfile.bz2
目前大部分版本的Linux中,bunzip2其实只是去调用bzip2,顺便帮您加上个 -d 选项罢了(用链接文件做的),并不是一个真的程序。
由于bzip2本身可以负责压缩,也可以解压缩,一物两用(不见得每种压缩和解压缩程序都是这样。)。所以,如果您记得 -d 选项,那就可以根本不用记 bunzip2 这个命令了。
但记得我们在 bzip2 命令时提过,bunzip2/bzip2程序解压时所需的内存为:
内存用量=400KB+(block 大小×4)
因为解压时的block 大小已经在压缩时决定了,所以不用选项决定。但是,我们有改变那个“×4”倍的机会。如果我们在解压时加了 -s 的选项,它会这样去计算:
内存用量=400KB+(block大小×2.5)
很显然,-s 是 small的意思,它可以节省一半内存用量。
表2-6所示为bzip2 和 bunzip2 压缩和解压缩时的内存用量总表。
表2-6 内存用量总表
压缩时的选项 | 压缩时用量 | 解压时用量 | 加了 -s 选项解压时用量 |
-1 | 1 100 KB | 500 KB | 350 KB |
-2 | 1 800 KB | 900 KB | 600 KB |
-3 | 2 500 KB | 1 300 KB | 850 KB |
-4 | 3 200 KB | 1 700 KB | 1 100 KB |
-5 | 3 900 KB | 2 100 KB | 1 350 KB |
-6 | 4 600 KB | 2 500 KB | 1 600 KB |
-7 | 5 400 KB | 2 900 KB | 1 850 KB |
-8 | 6 000 KB | 3 300 KB | 2 100 KB |
-9 | 6 700 KB | 3 700 KB | 2 350 KB |
另外,bunzip2一般常用到的选项如下:
-v 解压缩过程当中显示进度。
-k 解压缩,但保留原压缩文件。
同样,这些选项也可以再加在 bzip2 -d 上,效果一样。
练习:
因为 tar并未附有连同 .bz2 文件解压的选项(但附有连同 .gz 文件或 .Z 文件解压的选项),这样您会整个解开 xxxxx.tar.bz2 文件吗?