技术简介
MADS转录因子的同源蛋白SEPALLATA3 (SEP3)和AGAMOUS (AG)是调控拟南芥花发育分化的重要DNA结合蛋白。在雌蕊发育阶段,SEP3和AG形成异源四聚体,通过识别CArG-box序列来调控基因的表达。Seq-DAP-seq技术与ChIP-seq联合使用,可用于分析转录因子的DNA结合域与基因组的互作。
文献速递
2020年发表在Nucleic Acids Research上的“Genome-wide binding of SEPALLATA3 and AGAMOUS complexes determined by sequential DNA-affinity purification sequencing”文章,发现MADS-TFs多聚化类型影响DNA结合域蛋白的全基因组结合模式和靶基因的表达。文章开发了一种seq-DAP-seq技术用于转录因子与全基因组的互作研究,并结合RNA-seq技术检测靶基因表达。
研究首先构建了三种质粒分别表达三种多聚体蛋白,分别为SEP3同源二聚体(纯化标签为3×FLAG)、SEP3-AG异源四聚体(纯化标签为3×FLAG和5×MyC)和SEP3Δtet-AG异源二聚体(纯化标签为3×FLAG和5×MyC)。使用多标签顺序纯化的方式分离异源多聚体蛋白(Figure 1. A)。这种方法可筛选出MADS复合体用于DNA亲和纯化测序。所有DAP-seq和seq-DAP-seq实验均使用拟南芥Col-0基因组DNA文库进行。研究通过统计SEP3、SEP3Δtet-AG和SEP3-AG的共有峰和特定峰来分析他们的全基因组结合位点(Figure 1. C-F)。对转录因子结合位点(TFBS)进行建模,发现这些不同的复合物具有高度相似的CArG-box序列(Figure 2)。
Figure 1. Seq-DAP-seq workflow and data analysis.
Figure 2. Modeling of TF binding sites.
研究比较了SEP3-AG异源四聚体和SEP3Δtet-AG异源二聚体的seq-DAP-seq数据,结果表明与SEP3Δtet-AG相比,SEP3-AG具有更高的DNA结合亲和力和丰富的CArG-box结合空间位置(Figure 4. A-B)。为了验证这一结果,研究使用KNUCKLES (KNU)启动子生成了不同间距DNA片段的KNU启动子CArG-box结合位点进行EMSAs检测分析。结果表明,四聚化不仅允许获得不同的结合模式,而且与具有强间隔偏好的双位点结合,而二聚体优先结合单个高亲和力位点,但不能与较低亲和力的二级位点相互作用。
Figure 4. Analysis of intersite spacing for SEP3-AG, SEP3 and SEP3Δtet-AG.
研究比较了Seq-DAP-seq(体外)与ChIP-seq(体内)检测中的AG、SEP3或前两者都包含的结合区域,发现seq-DAP-seq和ChIP-seq结合区域相关的基因之间有显著的重叠(Figure 5. A-C),进而确定了受调控的靶点。研究通过比较突变体花序分生组织RNA-seq数据,获得了受SEP3调控的基因。研究发现SEP3-AG靶标的seq-DAP-seq和ChIP-seq具有高度重叠,与AG和/或SEP3相比差异表达基因(DEGs)比例显著,表明能够通过seq-DAP-seq识别那些在体内被SEP3-AG复合物结合和调控的转录因子结合位点。研究还发现了仅在seq-DAP-seq中而不在ChIP-seq中的结合位点,表明他们是SEP3-AG复合物的新靶点。
Figure 5. Venn diagrams for seq-DAP-seq, ChIP-seq and RNA-seq datasets.
小结
seq-DAP-seq具有纯化转录因子(TF)复合物和直接定位于基因组DNA的优势,可确定特定TF复合物(SEP3-AG异源四聚体)的潜在全基因组结合位点。seq-DAP-seq和RNA-seq数据的组合,能够鉴定出ChIP-seq实验中可能不存在的已知和潜在的新直接靶标。与ChIP-seq相比,seq-DAP-seq可以在单碱基水平上检测基因组结合位点的位点间距,从而提高TF-DNA互作检测的准确性。