1. SRA Tookit
cat srr.txt | while read id; do (prefetch ${id} );done
注: srr.txt储存sra检索号名字
2. aspera结合SRA Tookit
prefetch -t ascp -a ".aspera/connect/etc/asperaweb_id_dsa.openssh" --option-file srr.txt -O 输出目录
-a 必须要用绝对路径写上ascp所在的位置和previte KEY 的位置,否则下载速度会变慢
3. 迅雷
链接: ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR检索号前3位/SRR检索号/SRR检索号.sra
例子: ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR563/SRR5631562/SRR5631562.sra
4. wget
- 获取链接
- 下载
wget https://sra-download.ncbi.nlm.nih.gov/traces/sra60/SRR/006632/SRR6791470
注:
1)如果网速不好下载数据不完整
2)也可以使用curl URL -o 输出目录 --progress来进行下载
5.NCBI-sra数据链接汇总
SRP(Studies)—>SRX(Experiments)—>SRS(Samples)—>SRR(Runs)
Studies: 一个特定目的的研究课题,包含了项目的所有 metadata,一个study 可能包含多个Experiment
Experiments: 实验,包含了Sample、DNA source、测序平台、数据处理等信息。一个Experiment可能包含一个或多个runs
Runs: 表示测序仪运行所产生的reads
Sample: 样品信息,包括物种信息、菌株(品系) 信息、家系信息、表型数据、临床数据,组织类型等
-
GSExxx
链接:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE
例子:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE111229
-
SRP/SRA/SAMNxxx
链接:https://www.ncbi.nlm.nih.gov/sra?term=SRP/A
例子:https://www.ncbi.nlm.nih.gov/sra?term=SRP133642
例子:https://www.ncbi.nlm.nih.gov/sra?term=SAMN08619912
SRP其他链接:https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP078156&o=acc_s%3Aa
-
SRXxxx
链接:https://www.ncbi.nlm.nih.gov/sra/SRX
例子:https://www.ncbi.nlm.nih.gov/sra/SRX3749902
- PRJNAxxx
链接:https://www.ncbi.nlm.nih.gov/bioproject/PRJNA
例子:https://www.ncbi.nlm.nih.gov/bioproject/PRJNA436229
- SRRxxx
链接:https://trace.ncbi.nlm.nih.gov/Traces/sra/?run=SRR
例子:https://trace.ncbi.nlm.nih.gov/Traces/sra/?run=SRR6790711
6. EBI数据下载
ENA数据库:隶属EBI ,功能等同SRA,对保存的数据做了注释,界面相对于SRA更友好,可以直接下载fastq 文件
-
参考链接:
https://www.jianshu.com/p/cf0a7b937413
https://mp.weixin.qq.com/s/8xWl_DAYhFnLjdlg5ZcdIw -
下载方法
1)搜索ENA主页
2)在view搜索栏输入SRR号,如SRR1805951并点击搜索
3)在show selected columns选择希望显示的列,然后下载报告
4)文件里含有fastq和sra数据的链接
fastq
链接:ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR前3位/00最后1位/SRR号/SRR号_1或者2.fastq.gz
例子:ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR180/001/SRR1805951/SRR1805951_1.fastq.gz
sra
链接:ftp://ftp.sra.ebi.ac.uk/vol1/srr/SRR前3位/00最后1位/SRR号
例子:ftp://ftp.sra.ebi.ac.uk/vol1/srr/SRR180/001/SRR1805951
5)aspera下载
for i in {29..64} #i为SRR最后两位
do
a0='/路径/.aspera/connect/bin/' #aspera路径
a1='ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR前3位/00' #下载命令
a2=$(($i % 10))
a3='/SRR前5位'$i
a4='_1.fastq.gz .' #fastq后缀,.代表当前目录
a5='_2.fastq.gz .'
echo $a0$a1$a2$a3$a3$a4
echo $a0$a1$a2$a3$a3$a5
done >> ascp.command
#执行
nohup bash ascp.command &