生信搬运工-02-sra文件的下载

生信搬运工-02


一、SRA数据库

SRA数据库: Sequence Read Archive:隶属NCBI (National Center for Biotechnology Information),它是一个保存大规模平行测序原始数据以及比对信息和元数据 (metadata) 的数据库,所有已发表的文献中高通量测序数据基本都上传至此,方便其他研究者下载及再研究。其中的数据则是通过压缩后以.sra文件格式来保存的,SRA数据库可以用于搜索和展示SRA项目数据,包括SRA主页和 Entrez system,由 NCBI 负责维护。

ENA数据库:European Nucleotide Archive:隶属EBI (European Bioinformatics Institute),功能等同SRA,并且对保存的数据做了注释,界面相对于SRA更友好,对于有数据需求的研究人员来说,ENA数据库最诱人的点应该是可以直接下载fastq (.gz)文件,由 EBI 负责维护。

两者在主要功能方面非常类似,同时数据互通。

二、sra文件下载方式

1.SRA Toolkit安装与使用

SRA Toolkit是ncbi下载.sra文件和转换.fastq文件的极好工具。
首先,到ncbi官网点击Download–>Download tools,找到SRA Toolkit,点击Download,找适合自己的版本,比如CentOS Linux64位,复制链接,在服务器上用wget下载。

下载

wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.0/sratoolkit.3.0.0-centos_linux64.tar.gz

解压缩,并配置环境

tar xzvf sratoolkit.3.0.0-centos_linux64.tar.gz
cd sratoolkit.3.0.0-centos_linux64/bin | pwd | cd ..    #复制路径
echo 'export PATH=$PATH:/home/hongsheng_zhong/software/sratoolkit.3.0.0-centos_linux64/bin ' >> ~/.bashrc
source ~/.bashrc            #添加环境变量
vdb-config --interactive    #会出现一个框架,按字母x键退出,然后就可以使用啦
prefetch -V                 #安装成功测试

下载SRA命令

prefetch SRR1553610    #下载.sra文件
fastq-dump --split-e ./SRR1553610/SRR1553610.sra  #将.sra文件转换成.fastq文件

.sra转换成fastq格式文件

fastq-dump --split-3 SRR1553610.sra
经测,速度很快
#单个数据下载
prefeth SRR4045218 -O output  #output为数据输出路径
#批量下载,提前准备好SRR编号的TXT文件
prefetch -O output --option-file SRR_Acc_List.txt
通过数据库查找对应SRR号可以获取数据链接。一般都显示在“Data access”界面下。

超过20G的文件使用wget下载

wget -c -t 0 -O 	SRR4045218.sra https://sra-downloadb.be-md.ncbi.nlm.nih.gov/sos3/sra-pub-run-19/SRR4045218/SRR4045218.1

2.grabseqs下载sra数据

第四种下载方式的优势在于可以直接将下载的sra数据直接转换为fastq文件。该软件基于python3,可使用pip安装。

#安装
pip3 install grabseqs
#下载数据
grabseqs sra -t 6 SRR000000 SRP000000 PRJNA000000

总结

sra里保存着测序的.sra格式的原始文件,一般有四种下载方式,以上介绍sratoolkit、grabseqs两种方式,另外可以直接在数据库里用链接下载,或者使用aspera下载数据。
原文链接:https://blog.csdn.net/weixin_45214599/article/details/114847650
原文链接:https://blog.csdn.net/weixin_44065382/article/details/120378765

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值