bsseq
主要用来分析WGBS的数据, 安装过程如下
source(“http://bioconductor.org/biocLite.R“)
biocLite(“bsseq”)
bsseq
的分析主要包括以下4步:
- 读取原始数据
- BSmooth
- t-test检验
- DMR
1. 读取原始数据
bsseq
要求的原始数据格式如下:
共6列数据,制表符分隔,每一行代表一个甲基化位点,前5列很好理解,描述甲基化位点的染色体位置和类别,默认情况下bbseq
用于分析CpG
类型的甲基化位点。当然其他类型的数据,比如CHG
, CHH
也支持,但是需要调整参数。Cov
代表覆盖到这个位点的reads数,M
代表其中发生了甲基化的reads数目。
每个样本一个这样的原始数据,用来表示该样本methylation calling