温馨提示:本章内容图片很多,建议在电脑上观看。
通过GenomeStudio的methylation 模块,可以方便的对甲基化芯片数据进行分析。这个软件主要提供了定量和差异两种分析,今天先看一下如何进行定量分析。
在使用软件之前,我们必须先准备好输入文件,需要两种类型的输入文件:
甲基化芯片的原始数据
芯片的注释信息,后缀为 .bpm 的文件
以illumina 官方下载的450K Demo 数据集为例,解压缩之后的文件如下图
HumanMethylation450_15017482_v.1.1.bpm 是450K 芯片的探针注释文件,可以从官网下载得到;5640269011
是芯片的Sentrix_ID
, 在这个目录下是该芯片上的12个样本的原始数据,目录结构如下
5640269011/
├── 5640269011_R01C01_Grn.idat
├── 5640269011_R01C01_Red.idat
├── 5640269011_R01C02_Grn.idat
├── 5640269011_R01C02_Red.idat
...
├── 5640269011_R06C02_Grn.idat
├── 5640269011_R06C02_Red.idat
当芯片原始数据和探针注释文件准备好之后,就可以开始分析。GenomeStudio
软件中有三个概念:
project
groupset
group
分析时,我们首先需要新建一个project ,在这个project 下,包含所有待分析的