SRA 数据库, 为Sequence Read Archive 的缩写。主要存储高通量测序的原始数据,来自四个测序平台,分别为:Roche_LS454,Illumina,ABI_SOLID和HELICOS。
从事生物信息分析的老师和同学一般都会接触SRA数据,下载SRA数据的方法也有很多,这里来简单总结一下。
方法一:SRA Tookit下载
SRA Tookit 是NCBI 提供的下载软件,我们需要下载安装,下载地址:https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software 。
选择需要的SRA Tookit 版本进行下载,下载后直接解压到某个指定位置即可。然后搜索SRA数据,例如,我们要下载SRP108428(阅读文献可以找到公开数据的project号)下的所有数据,打开NCBI网址:https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP108428(此处为project号),点击"Accession List"键,下载得到SRR List 储存在sra.txt文件中。
得到sra.txt文件如下: