GEO(Gene Expression Ommius datasets):
该数据库搜集了大量表达谱,甲基化,lncRNA,miRNA,CNV等芯片数据
该数据信息包括了:
- GPL:GEO Platform 数据平台
- GSM: GEO Sample 样本的ID
- GSE: GEO Series 研究ID
- GDS: GEO Datasets 数据集的ID
该数据类型包括了:
- SOFT:包括了探针与基因对应关系的注释文件,样本单独表达量,所有信息文件。
- MINIML : XML格式的所有数据
- Series Matrix:所有样本表达矩阵的数据文件
- TAR(of CEL,EXP):芯片原始数据文件(GDSbrowser可查询文件)
经验证明:
- 部分Series Matrix 文件并不含有样本表达矩阵数据;