欢迎关注”生信修炼手册”!
后缀为cel的芯片文件,对应的芯片平台为Affymetrix, 针对这一平台的数据,可以通过R包affy来读取,读取时我们需要以下两种文件
1. 后缀为cel的探针荧光信号强度文件
2. 后缀为cdf的探针布局文件
cel文件是芯片扫描之后的原始数据文件,而cdf文件是每个芯片平台对应的文件,cdf格式的详细解释可以参考如下链接
https://media.affymetrix.com/support/developer/powertools/changelog/gcos-agcc/cdf.html
部分内容截图如下
针对一些常用芯片, bionconductor annotation收录了对应的cdf注释信息,链接如下
http://master.bioconductor.org/packages/release/data/annotation/
在读取数据的过程中,affy会根据芯片平台自动化地从annotation中下载对应的cdf包,对于那些cdf文件没有收录在annotation中的芯片,就只能通过makecdfenv包手动创建对