SRA Toolkit简单使用(prefetch和fastq-dump)

工具下载网址:

01. 下载 SRA Toolkit ·ncbi/sra-tools 维基icon-default.png?t=O83Ahttps://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit

 我下载的是linux 3.0.10版,目前最新版如下:https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.1.1/sratoolkit.3.1.1-centos_linux64.tar.gz

prefetch使用 

1.prefetch下载单个数据

prefetch SRR547531

2.prefetch批量下载数据
 

prefetch --option-file list.txt --output-directory /your/download/path

list.txt内容如下:

ERR274310  
SRR547531  
SRR548277  
SRR847503  
SRR847504  

运行结果如下:


fastq-dump使用

1.fastq-dump转换sra为fastq格式

fastq-dump SRR547531  --gzip --split-3

--split-3 :不知道sra是单端还是双端,默认使用

我发现下载的时候是一个文件夹,文件夹里有一个sra数据,转换的时候,直接输入SRR547531即可完成转换,而不用输入SRR547531/SRR547531.sra

结果如下:

2.fastq-dump批量转换

for id in `cat list.txt`
do
fastq-dump  /your/download/path/${id} --gzip --split-3 -O /your/path
done;

附加信息-完整参数

1.prefetch -h

Usage:
  prefetch [options] <SRA accession> [...]
  Download SRA files and their dependencies

  prefetch [options] --cart <kart file>
  Download cart file

  prefetch [options] <URL> --output-file <FILE>
  Download URL to FILE

  prefetch [options] <URL> [...] --output-directory <DIRECTORY>
  Download URL or URL-s to DIRECTORY

  prefetch [options] <SRA file> [...]
  Check SRA file for missed dependencies and download them


Options:
  -T|--type <value>                Specify file type to download. Default: sra 
  -t|--transport <http|fasp|both>  Transport: one of: fasp; http; both 
                                   [default]. (fasp only; http only; first try 
                                   fasp (ascp), use http if cannot download 
                                   using fasp). 
  --location <value> 
在进行息学分析时,获取处理NCBI SRA数据库中的二代测序数据是重要的第一步。为了帮助你更好地掌握这一过程,推荐查看这份资料:《NCBI SRA数据库操作指南:从查询到下载测序数据》。这份资源将为你提供从数据检索到分析的完整指南,直接关联到你当前的问题。 参考资源链接:[NCBI SRA数据库操作指南:从查询到下载测序数据](https://wenku.csdn.net/doc/57tm0nutaa?spm=1055.2569.3001.10343) 首先,要下载特定的二代测序数据集,你需要安装SRAToolkit。通过SRAToolkit中的`prefetch`工具,可以下载SRA数据。例如,如果你想下载SRR编号为SRR1234567的测序数据集,你可以使用以下命令: ``` prefetch SRR1234567 ``` 下载完成后,你可以使用`fasterq-dump`工具将数据转换成更易处理的fastq格式: ``` fasterq-dump SRR1234567 ``` 接下来,进行序列读取,你可以使用fastq-dump工具来读取fastq文件,或者使用其他支持fastq格式的息学工具。例如: ``` fastq-dump --gzip SRR1234567.fastq ``` 一旦获得序列读取文件,你可以使用序列比对工具,如BWA或Bowtie2,将序列与参考基因组进行比对。比对后,使用SAMtools或Picard工具对比对结果进行处理,提取比对息。具体命令参数会根据所选工具而有所不同。 通过以上步骤,你将能够从NCBI SRA数据库中下载特定的二代测序数据集,并完成序列读取比对息分析。掌握了这些技能后,你将能够进行深入的息学研究。如果希望进一步提高技能并深入理解NCBI SRA数据库的操作应用,建议继续阅读《NCBI SRA数据库操作指南:从查询到下载测序数据》。这份资料详细介绍了每个步骤的细节,能够帮助你在息学领域更加得心应手。 参考资源链接:[NCBI SRA数据库操作指南:从查询到下载测序数据](https://wenku.csdn.net/doc/57tm0nutaa?spm=1055.2569.3001.10343)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值