S R A 数据库, 最初的命名为Short Read Archive,现已改为SequenceRead Archive。
SRA 数据库的组织架构
1,meta 数据是指与测序实验及其实验样品相关的数据, 如实验目的、 实验设计、 测序平台、 样本数据(物种, 菌株,个体表型等),在SRA数据库中,meta数据分如下层次来存储:
(1)研究课题(study)。 在 SRA 数据库中, 研究课题的检索号(accession number)以前缀 DRP, ERP 或SRP 开头。
(2)样本信息(sample)。 样本的检索号以前缀 DRS, ERS 或 SRS开头。 样本信息可以包括物种信息、 菌株(品系)信息、 家系信息、 表型数据、 临床数据, 组织类型等。
(3)实验信息(experiment)。实验的检索号以前缀DRX, ERX 或 SRX 开头。 实验是 SRA 数据库的最基本单元, 就像 PubMed 数据库的每一篇文献是 PubMed数据库的基本单元一样。 一个实验隶属于某个研究课题, 对一个或多个样本进行测序, 产生的测序数据以 runs 的形式存储于 SRA 。
2,序列数据
包括序列及其质量信息等, 在 SRA 数据库中以run 为单元存储。 run 的检索号以前缀 DRR, ERR 或SRR 开头。
3。SRA 数据库中的测序数据来自四个测序平台
分别为: Roche_LS454,Illumina,ABI_SOLID和HELICOS。