欢迎关注”生信修炼手册”!
本文要解读的文献如下
于2013年发表在nature methods杂志上,引用多达2115次。作为ATAC的开篇之作,在文章中详细介绍了ATAC的原理及应用,分为了以下几个部分
1. ATAC的实验方法
ATAC通过tn5转座酶来富集开放染色质区域的DNA序列,经PCR扩增后进行NGS测序,实验流程如下图所示
相比DNase-seq, FAIRE-seq, 该技术要求的细胞起始量低,而且文库构建耗时短,统计结果如下图所示
上图中的左侧描述了不同实验方法所需的细胞起始量,可以看到ATAC所需细胞最少,右侧描述了文库构建时间的长短,可以看到ATAC在1天之内就可以完成文库构建。
通过比较不同实验方法捕获构建的文库的一致性,发现ATAC重复性好,而且与其他实验方法的一致性高,对应的信号图如下所示
信号分布的峰型基本一致,相关性结果如下所示
可以看到,相关系数都较高,两个ATAC文库的相关性则高达0.97。
2. ATAC的插入片段揭示了核小体的位置
通过对ATAC文库中插入片段的长度进行分析,观察到了一种很有意思的现象,示例如下
可以看到,200bp之后,插入片段的峰值有一个周期性的波动,取log之后,这个趋势更加明显。单个核小体是由146bp的DNA缠绕在组蛋白上构成的,这里的周期性表示的是不同核小体的个数,说明ATAC可以定位核小体边界。
进一步对ATAC文库的插入片段进行探究,观察不同长度的序列对应的染色质状态,结果如下
可以看到,当插入片段的长度非常短时,在CTCF结合区域富集。对于转录起始TSS区域而言,对应的插入片段长度在1到3个核小体周期的长度。而promote对应的插入片段长度则非常长。
ATAC文库中,位于两个相邻核小体之间的序列,称之为nucleosome-free fragments, 简称NRF。这部分序列的peak可以用来表征TSS的位置,如下图所示
对于THAP8和WDR62两个基因而言,ENCODE CAGE测到的序列表征了这两个基因的TSS区域。可以观察到,ATAC文库中NRF序列的peak也很好的表征出了这两个T