欢迎关注”生信修炼手册”!
在chip_seq数据展示时,经常会用到bigwig文件,导入igvtools等基因组浏览器中,产生如下所示的图片
我们将IP样本相对Input样本中reads富集的区域定义为peak, 反映到上图中,则对应的为IP样本中reads出现了峰值,比如下图红色标记的区域
通过这种可视化的方式,可以直观的反映出peak区域的情况,但是在实际使用中需要注意归一化的问题。
bigwig文件本质上展示的是测序深度的分布信息,而原始的测序深度是和测序的reads量呈正相关关系的,比如Input样本测序5G, IP样本测序10G, 在原始的测序深度看,会看到Input样本相比IP样本,其测序深度是偏高的。当然这个是一个极端的例子,但是很好的说明了测序量的差异对原始的测序深度会有直接的影响。
为了消除样本间测序数据量差异的影响,很当然的我们想到了归一化,类似转录组中的定量策略,原始的测序深度就是raw count, 那么当然类似R