GEO数据库
GEO数据库隶属于NCBI,是最大最全面的基因表达数据库,主要是芯片和转录组测序数据。除储存数据外,也提供一些数据挖掘工具,因此利用好这个数据库,没有实验,没有自己的数据也能发好文章!
https://www.ncbi.nlm.nih.gov/geo/
SRA文件的存放
从NCNI的这个站点(https://www.ncbi.nlm.nih.gov/projects/faspftp/)可以看出,sra原始的reads数据是在sra/sra-instant/下的,该目录下的analysis是分析结果文件
reads目录下,又分为ByExp,ByRun和ByStudy三个目录,每个目录下都有sra子目录,而且又分为三个子目录,所以从这里找sra文件是非常繁琐的。不如从GEO主页上直接搜索编号。