prefetch下载SRA 数据

1. SRA数据库简单介绍 

 

序列读取档案(SRA)存储来自“下一代”测序技术的原始序列数据,包括Illumina、454、IonTorrent、Complete Genomics、PacBio和Oxford纳米孔。除了原始序列数据外,SRA现在还以读取位置的形式在参考序列上存储对齐信息。

2. 四种类型的数据

  1. STUDY with accessions in the form of SRP#, ERP#, or DRP#
  2. SAMPLE with accessions in the form of SRS#, ERS#, or DRS#
  3. EXPERIMENT with accessions in the form of SRX#, ERX#, or DRX#
  4. RUN with accessions in the form of SRR#, ERR#, or DRR#

3. SRA 软件工具包的下载

官网地址 下载系统对应的文件​​​​​​​

4. 安装和配置

解压:

tar xzvf sratoolkit.2.11.1-centos_linux64.tar.gz

进入bin目录 运行如下命令进行配置

./vdb-config --interactive 

5. 下载

下载单一文件到当前目录

vim ~/.bashrc
# 最后一行加入 export PATH=sratoolkit_bin_dir:$PATH
source ~/.bashrc 立即生效

prefetch -p SRR62322

-o -O 参数分别指定下载文件名称和目录。

下载多个文件,file.txt  含有多个sra号

prefetch ​​​​​​​--option-file file.txt

prefetch 官方教程​​​​​​​

​​​​​​​6.表型数据下载

SRA的表型数据可以到NCBI的SRA Entrez搜索查看也可以下载如下图

7. 转化成fastq文件

双端测序,加--split-files参数

fastq-dump --split-files SRR6232298.sra

fastq-dump参考文档: fastq-dump官方教程​​​​​​​

​​​​​​​

​​​​​​​

  • 3
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值