chip_seq质量评估之cross correlation

本文详细介绍了CHIP-seq数据质控的关键指标——Cross Correlation,源于Nature Biotechnology的一篇论文。通过对峰位点两侧reads分布的分析,揭示了reads的对称性和中心偏移规律。通过泊松相关系数衡量正负链测序深度的相关性,形成Cross-correlation profiles,用于评估数据质量。高质量的CHIP-seq数据应显示明显的CHIP peak,且NSC和RSC指标处于5到12之间,这两个指标与F RIP Score相关,可用于判断实验成功与否。
摘要由CSDN通过智能技术生成

欢迎关注”生信修炼手册”!

chip_seq数据的质控是非常重要的,本文介绍数据质控的一个重要指标之一corss correlation。这个概念首发于以下文献

Design and analysis of ChIP-seq experiments for DNA-binding proteins

发表在nature biotechnology上,网址如下

https://www.nature.com/articles/nbt.1508

在该文章中对chip_seqs数据分析的完整pipeline进行了探究和解释,其中提出了一个peak位点两侧reads分布的规律,如下所示

图中所示的是一个NRSF转录因子结合位点两侧的reads分布,将reads分成了比对到正链和负链两部分。从黑色的密度分布曲线可以看到,二者符合同一个高斯分布。灰色竖线代表的是结合位点的中心,而reads密度分布的中心点距离peak的中心点有一定偏移。

从这张图可以发现两个规律,第一点peak位点附近的正负链上reads分布相同,第二点reads分布的中心点和peak的中心点存在偏移。为了量化这两个规律,科学家们提出了strand cross-correlation这个概念,考虑到reads分布相同而各自的中心点又存在一定距离,那么将reads的位置移动一定距离之后,正负链的中心重合,此时二者对称分布,可以参见下图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值