欢迎关注”生信修炼手册”!
chip_seq是研究转录因子结合,组蛋白修饰的利器,这项技术虽然经过了很多年的发展,但是由于不同抗体的特异性,不同样本处理的复杂性,如何保证chip数据的高质量仍然是一个挑战。为了保证分析结果的可靠性,无论实验也好,分析也好,都需要一系列的质控指标,以保证最终结果的正确性。
ENCODE团队进行了大量的chip_seq数据分析,处理过来自人,小鼠等4个物种的超过100种细胞类型,140多种转录因子或者组蛋白的chip实验和分析,积累了丰富的经验,并最终总结出一份chip_seq指导手册,文章发表在Genome Research上,链接如下
https://genome.cshlp.org/content/22/9/1813.full
在这篇文章中从实验到数据分析都给出了很多的参考建议,本文主要讨论的是FRip Score这个质控指标。FRiP指的是fraction of all mapped reads that fall into peak regions. 代表peak区域内reads的比例,peak区域内的reads是抗体富集的序列,其他区域的序列是背景噪声。
只有mapping到基因组上的reads才会进行后续分析,所以直接用peak区域reads数目除以所有mapping基因组的数目,就得到了FRiP Score。Encode团队发现FRip Score和peak的个数存在正相关关系,结果如下