一个物种的完整测序文件常常有数十G的大小,加上一次实验不止一个样本。这让我们的硬盘显得有些拮据了。好在测序结果属于文本内容,压缩率很高。因此如果我们能够将它打包成压缩文件的话,就能节省七八成的空间。
在linux中,系统自带安装了zip、gzip和bzip2压缩工具。
1、gzip
gzip filename
输入上面这段代码可压缩【filename】文件。
注意,文件压缩后,【cat】命令无法查看文件内容,但是我们仍然可以使用【less】、【zcat】等命令查看文件内容。
2、zip和bzip2
这两个的操作与gzip基本相同,这里不多赘述。
3、文件打包——tar
相比于压缩文件,在linux中更常用的是【tar】命令。【tar】命令可用于打包数个文件,但既然都打包了,就顺便把文件压缩下。所以,打包和压缩这两个动作通常由【tar】一起承包。
tar命令参数 | 效果 |
---|---|
-c | 创建新包 |
-f | 指定包名 |
-r | 在原有包里添加新包 (如果包已压缩则无法添加) |
-u | 更新原有包中的同名文件 (如果包已压缩则无法更新) |
-t | 列出包中文件 |
-x | 解包 |
-z | 调用gzip打包,以【.gz】为后缀 |
-j | 调用bzip打包,以【.bz2】为后缀 |
-v | 显示打包/解包进程 |
我们在日常使用时,一般多个参数组合使用。
如:
tar -zcvf character.tar.gz A.txt B.txt C.txt
#把 A.txt B.txt C.txt 这三个文本文件打包压缩并命名为character.tar.gz
tar -zxvf character.tar.gz -C ../Documents/
#调用gzip解包文件,并将解压文件输出至指定目录
创建打包文件名时,在后缀上尽量完整列出是使用什么工具打包和压缩的,方便将来使用。