参考SRA ToolKit(v 3.1.1)安装和使用(Bioinformatics tools-032)
01 数据下载部分
第一步:在PubMed、Science Direct、Web of Science上查找相关文献。
第二步:根据文献的“材料与方法”部分,了解RNA-Seq数据的存储方式。
02 NCBI唯一编号
在NCBI的SRA工具中找到下载所需的SRR编号。
现在,公共 SRA 文件可以通过 GCP 和 AWS 云平台以及 NCBI 访问。在云端访问大多数数据需要用户在云服务提供商处拥有账户。用户的账户将因云计算或将数据复制到指定的云服务区域外而产生费用。三个地址都可以,一般选AWS快一点稳定。NCBI亦可。
点击
https://sra-downloadb.be-md.ncbi.nlm.nih.gov/sos3/sra-pub-run-36/SRR026/26717/SRR26717485/SRR26717485.1
即可下载到本地。
03 下载安装
#命令行下载
prefetch SRR26717485 #一个
prefetch --option-file sraid.txt #多个
###使用循环,通过 `prefetch` 命令下载数据。
for i in `seq 23 XX`;
do
prefetch SRR35899${i};
done
知识点:如何使用循环批量下载数据。
注:数据量较大,下载可能需要较长时间。在此期间,可以阅读文献并学习文章中使用的分析方法。