NCBI中SRA数据库简介
SRA数据库简介
SRA 数据库, 为Sequence Read Archive 的缩写。主要存储高通量测序的数据,来自四个测序平台,分别为: Roche_LS454,Illumina,ABI_SOLID和HELICOS。
SRA 数据库的组织架构
首先是项目编号,通常以PRJ开头,会记录该项目的一些背景信息,包括,研究的目的及意义,项目启动日期,作者单位信息等等,项目下面可以包含以下子内容:
(1)研究内容(study)。 在 SRA 数据库中, 研究课题的检索号(accession number)以前缀 DRP, ERP 或S R P 开头。
(2)样本信息(sample)。 样本的检索号以前缀 DRS, ERS 或 SRS开头。 样本信息可以包括物种信息、 菌株(品系)信息、 家系信息、 表型数据、 临床数据, 组织类型等。
(3)实验信息(experiment)。实验的检索号以前缀DRX, ERX 或 SRX 开头。
(4) 数据信息,包括序列及其质量信息等, 在 SRA 数据库中以run 为单元存储。 run 的检索号以前缀 DRR, ERR 或SRR 开头。
SRA 数据库进入方法:在NCBI主页找到SRA就可以直接搜索了: National Center for Biotechnology Information
更多SRA数据下载: 从NCBI当中SRA数据库中下载高通量测序数据 - 组学大讲堂问答社区
高通量fastq测序数据查看: 超大的文本文件如fasta,fastq文件在windows中如何打开 - 组学大讲堂问答社区