软件测试于Ubuntu 16.04LTS
ubuntu环境下默认~/bin为个人环境变量目录
比较Linux系统自带gzip工具、多线gz压缩工具pigz、以及最新适合fastq压缩又快又小的软件GTX(自称只有传统gzip的1/6体积,实测单线程速度快了3倍,体积减少为gzip的2/3大小)
软件下载和安装
gzip系统默认,无须安装
pigz多线程压缩工具,可通过Ubuntu系统自带的新立德工具箱一键安装sudo apt-get install pigz
GTX压缩工具,由于是新算法,压缩格式不是gz,而是gtz格式# 下载软件
wget http://gtz.io/gtz_public_0.2.2k_ubuntu_release.tgz
# 解压
tar zxvf gtz_public_0.2.2k_ubuntu_release.tgz
# 进入程序目录
cd gtz_public_0.2.2k_ubuntu_release/
# 显示帮助
./gtz -h
# 添加环境变量,一定要软链,否则程序无法运行
ln -s `pwd`/gtz ~/bin/
软件测试
使用BGISeq500产生的PE100测序文件的一端作为测试。7.8GB,比较典型的测序样品大小。
压缩
不支持多线程的gziptime gzip -c test.fq > test.fq.gz
多线程压缩pigz# 注意-p一定要写下前面,后面无效
time pigz -k -p 32 test.fq
time pigz -k -p 8 test.fq