centos 安装trace_Sratoolkit安装和使用

本文档介绍了如何在CentOS 7环境下安装Sratoolkit,包括原版和加速版的安装步骤,以及如何验证安装成功。通过使用Sratoolkit将SRA格式数据转化为fastq格式,演示了数据转换命令和实际操作过程。
摘要由CSDN通过智能技术生成

前言:

NCBI数据库上的数据存储,是sra格式的,这样的格式将文本数据压缩的很小,而我们的测序下机数据一般是fastq格式的,所以我们下载完之后要利用sratoolkit进行解压

安装环境:

Centos Linux release 7.8.2003 (Core)

Sratoolkit.2.10.8-Centos_linux64

Sratoolkit安装和简单使用

进入到指定的软件目录:

cd /home/biological/biosoftware

Sratoolkit软件官网:

https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software

从网址中下载安装包,下载命令:

wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.10.8/sratoolkit.2.10.8-centos_linux64.tar.gz

解压:

tar xzvf sratoolkit.2.10.8-centos_linux64.tar.gz

添加全局变量:

echo "export PATH=$PATH:/home/biological/biosoftware/sratoolkit.2.10.8-centos_linux64/bin" >> ~/.bash_profilesource ~/.bash_profile

这样只能使用单线程处理,为了加快速度,我们安装多线程极速版,下载链接如下:

链接:https://pan.baidu.com/s/1qOHnNtqzVWQ3m8UbtGTmtg提取码:va83

解压之后将bin文件夹的pfastq-dump放入sratookit的bin文件夹,并且修改执行权限

 chmod a+x pfastq-dump

Sratoolkit原版及加速版的Sratoolkit软件到此就安装完毕了,可以利用fastq-dump –version和pfastq-dump –version命令检测是否正确安装fastq-dump和pfastq-dump,截图如下:

02f38210fc9d63e2ade9ec56074c81fd.png

测试数据我们用NCBI数据库中的编号为“SRR12062121”的数据,如果觉得麻烦也可以从下面的链接下载数据练习:

链接:https://pan.baidu.com/s/1P8C_SIopSlDfQ7kt5peQfA提取码:zsbz

如果想获取软件的使用说明或者其他帮助,可以利用pfastq-dump -h命令获取详细的技术文档。如下所示:

b4829bf110afc440bc1ffbb193386351.png

当我们要利用sratoolsratoolkit软件将数据格式转换为fastq 的话,需要用到以下命令(如果数据是双端测序,那么就要写入 --split-e 这个参数,如果是单端测序则不需要加):

-t:需要用到的线程数(越多速度越快,但是要按照自己机器的配置来选)

-s:要转换的SRA数据的ID

-O:输出目录

--gzip:可以选择输出的格式为zip的形式,也可以正常输出,后续的处理软件面对完全解压或者是压缩包两种格式都可以处理,所以按照自己电脑的配置来选择合适的参数调整命令:

进入到测试数据的目录下

cd /home/biological/biodata/test/RNAseq

所以我们利用pfastq-dump这个工具,利用8个线程将SRR12062121这个双端测序的sra格式文件转换成fastq格式并输出到/home/biological/biodata/test/RNAseq_out/目录下:

命令及测试截图如下:

pfastq-dump --gzip -s SRR12062121 --split-e -t 8 -o /home/biological/biodata/test/RNAseq_out/

e2791d9289cf16e8ceee4cce859fcf34.png

这时候我们进入到/home/biological/biodata/test/RNAseq_out/文件夹下:

cd /home/biological/biodata/test/RNAseq_out/

可以看到我们需要的数据已经转换完完毕:

c50494671bc57b5996d13c78c820e480.png

这时候可以利用

less SRR12062121_1.fastq.gz

命令查看转换完毕后的fastq文件了:

1f6ce4fbed3916eb9b3820692289fa07.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值