易基因｜ChIP-seq在植物蛋白质-DNA互作研究中的主要应用

易基因科技

于 2024-03-05 09:48:56 发布

阅读量938

点赞数 20

分类专栏：技术解读科普文章标签：生物学生物信息学经验分享数据挖掘

本文链接：https://blog.csdn.net/E_gene/article/details/136470080

版权

技术解读同时被 2 个专栏收录

154 篇文章 11 订阅

订阅专栏

科普

18 篇文章 0 订阅

订阅专栏

大家好，易基因科普栏目又来啦！今天给大家介绍ChIP-seq在植物蛋白质-DNA互作研究中的主要应用。

关于ChIP-seq

染色质免疫沉淀(ChIP)是一种分离特定蛋白结合的DNA片段的有效方法。该技术可以将待研究的蛋白质与其在物理上相关联的DNA片段共沉淀，结合高通量测序技术，对从ChIP中获得的DNA片段直接测序，称为ChIP-seq。比起以往的芯片杂交分析，ChIP-seq有更高的分辨率、覆盖率和特异性，已经成为一种流行的研究方法分析蛋白质-DNA互相作用。

1、CHIP-seq流程

模式植物(以水稻和拟南芥为例)的ChIP-seq检测流程如下：

实验部分，首先通过甲醛处理细胞使DNA结合蛋白与DNA交联，然后裂解细胞，超声打断染色质使之称为小片段，再使用特定的蛋白质抗体进行蛋白质-DNA复合物的免疫沉淀。为了保证高质量的数据，抗体和阴性对照的选择至关重要。最后通过逆转交联，从蛋白质中释放DNA片段，纯化释放的DNA片段。可以通过实时荧光定量PCR检测纯化DNA的质量，以确定待研究的基因组区域的富集情况。

测序和数据分析部分，首先创建一个纯化DNA片段的测序文库，可通过主流测序平台Illumina进行高通量测序。测序后，将原始的ChIPSeq数据转换为序列数据进行分析。可通过Fastqc程序(www.bioinformatics.bbsrc。ac.uk/projects/fastqc/)或Fastx-toolkit (http:// hannonlab.cshl.edu/fastx_toolkit/)，去除原始数据中的接头和低质量序列，然后使用绘图程序，如Bowtie (http://bowtiebio.sourceforge.net/index.shtml))，将reads比对到参考基因组。接着就可以在全基因组范围内识别待研究的蛋白质的假定结合位点，称为peaks。这个过程可以通过各种算法和程序，例如MACS (http://liulab.dfci.harvard.edu/MACS/)和QuEST (http://mendel.stanford.edu/sidowlab/ downloads/ QuEST /)，以及常用于植物的CisGenome (www.biostat.jhsph.edu/~hji/cisgenome/)。最后，结合序列基序的分析可以通过MEME、 DREME或MEME-chip来完成(http://memesuite.org/)。

2、CHIP-seq在植物中的应用

2.1 TF（转录因子）结合位点和靶基因的全基因组鉴定

TFs与特定的DNA靶序列(或顺式调控元件)的结合是基因调控网络的基础。ChIP-seq能够精确测定TF结合位点在体内的全基因组分布。对许多植物转录因子的研究也证实了这一点，转录因子参与了单子叶植物和双子叶植物不同组织或不同发育阶段的发育、生物钟、开花时间、激素信号、非生物或生物胁迫的调节。

Illumina GA II或HiSeq X是目前最常用的ChIP-seq深度测序平台。将reads比对到参考基因组后，识别基因组中reads富集峰的算法主要由MACS程序执行，少数情况下由QuEST、Cisgenome、ERANGE程序执行。根据不同的蛋白，识别出的峰数从数百到数万不等。根据基因组特征，这些峰的位置注释到转录起始位点(TSS)、5 ' UTR、3 ' UTR、外显子或内含子的上游序列。分布在TSS附近的区域是基因的启动子位点，被认为是TFs的靶点。此外，这些假定的靶基因的表达可以通过RNA-seq、芯片或qPCR进一步验证。从ChIP-seq数据中搜索结合位点的共同基序可能会识别出TF的顺式调控元件，例如PRRs和PIFs的G-box (CACGTG)，CCA1的EE (AAATATCT)。

2.2 全基因组组蛋白标记检测

组蛋白标记(如甲基化和乙酰化)在植物生长发育过程中对于调控基因表达以及应对不同环境胁迫发挥着重要作用。ChIP-seq可以对修饰后的组蛋白在体内的分布进行全基因组水平的检测。

Hussey等人(2015)利用ChIP-seq技术研究了组蛋白修饰H3K4me3在巨桉木质素发生的表观基因组调控中的作用，发现H3K4me3可以激活参与木质部发育的基因的转录。Hu等人(2012)利用ChIP-seq分析了玉米在冷胁迫过程中H3K9ac的全基因组分布和变化，结果表明，冷刺激导致H3K9ac显著降低。van Dijk等人(2010)的研究表明，在拟南芥中，H3K4me3的丰度在响应脱水胁迫的基因上也会发生显著变化。Zong等人(2013)在水稻中，用ChIP-seq检测到干旱胁迫下的转录本变化也与H3K4me3相关，H3K4me3的修饰水平在低表达基因上增加，在高表达基因上降低。Ayyappan等人(2015)利用ChIP-seq发现，在感染锈病时，H3K9me2和H4K12ac影响了大豆中大量的胁迫响应基因。

2.3 RNA聚合酶分布的全基因组分析

所有的真核生物都有三种RNA聚合酶(Pol I, II和III)，是转录所必需的。Liu等人(2014)在杨树中鉴定到6499个RNA Pol II的ChIP-seq峰，发现这些峰的分布与基因区域高度吻合，与转录本的丰度有很大的对应关系。此外，植物还有两种额外的聚合酶(Pol IV和Pol V)，在RNA导向的DNA甲基化中发挥重要作用。比如Zhong等人(2012)利用ChIP-seq在全基因组尺度上定位了拟南芥Pol V的靶点，发现Pol V在启动子和进化上最近的转座子上富集，这种定位模式与DNA甲基化和小RNA积累密切相关。

2.4对重复基因组序列测序的改进

异染色质或微卫星具有大量复制的序列，传统的测序技术很难对其进行测序。着丝粒序列通过串联重复存在大量的拷贝，如卫星DNA和反转录转座子，在不同的物种中，甚至亲缘关系相近的生物体中，都会存在着很大的差异，其高度保守的功能与其表观遗传特征有关，比如植物中的组蛋白H3变异CENH3，Guo等人(2016)利用CENH3特异性抗体进行ChIP-seq，发现了小麦4DS染色体新着丝粒中存在的异位基因组序列。同样，Nagaki等人(2015)利用CENH3-ChIP-seq技术分离了向日葵的着丝粒DNA序列，并鉴定出两种不同类型的重复DNA序列:串联重复序列和长散在重复序列。可以看出，ChIP-seq能够更高效地对重复序列区进行测序，而重复序列两侧的独特序列有助于将reads与基因组对齐。

2.5对基因组中可能缺失基因的注释

由于组蛋白修饰与活性转录位点有很高的重叠性，因此ChIP-seq可用于预测未注释的基因。例如，与水稻基因组注释资源MSU/ tiger (http:// rice.plantbiology. MSU .edu/)和RAP-DB (http:// rapdb.dna.affrc.go.jp/)相比，Du等人(2013)发现在MSU/ tiger中丢失注释的RAP-DB基因有6629个，在这些未注释的基因中，他们发现471个基因在TSS区域内同时富集H3K4me3和H3K9ac，并通过表达分析证明了这些基因的存在。虽然mRNA-seq可以系统地追踪缺失的基因，但ChIP-seq是检测基因组尚未被注释的生物体缺失基因序列的最佳方法之一。

易基因小结

蛋白质-DNA互作和表观遗传标记的全基因组图谱对于全面理解生物体的转录调控是必不可少的。DNA结合蛋白，包括转录因子、表观遗传因子和染色质修饰因子，控制着植物基因的表达。定位基因组中DNA结合蛋白的结合位点对基因调控网络的解码至关重要。染色质免疫沉淀(ChIP)和高通量测序(ChIP-seq)是一种广泛应用于识别体内特定蛋白结合的DNA区域的方法。从ChIP-seq中获得的信息能够极大地促进我们对植物中转录因子、辅助因子和组蛋白修饰调控基因表达的机制的理解。

参考文献：doi.org/10.21775/cimb.027.171

易基因科技

关注

20
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
易基因｜ChIP-seq在植物蛋白质-DNA互作研究中的主要应用

着丝粒序列通过串联重复存在大量的拷贝，如卫星DNA和反转录转座子，在不同的物种中，甚至亲缘关系相近的生物体中，都会存在着很大的差异，其高度保守的功能与其表观遗传特征有关，比如植物中的组蛋白H3变异CENH3，Guo等人(2016)利用CENH3特异性抗体进行ChIP-seq，发现了小麦4DS染色体新着丝粒中存在的异位基因组序列。从ChIP-seq数据中搜索结合位点的共同基序可能会识别出TF的顺式调控元件，例如PRRs和PIFs的G-box (CACGTG)，CCA1的EE (AAATATCT)。
复制链接

扫一扫

专栏目录