点击标题下「蓝色微信名」可快速关注
关键词: 叶绿体、基因组、细胞器、生物信息学
叶绿体基因组的生物信息分析内容还是比较多的,包括基于结构和功能的基础分析,还包含了比较基因组和群体基因组的高级分析。
相对于植物核基因组来讲,叶绿体基因组的开展更加迅速,从NCBI的统计数据来看近几年更是进入了爆发式增长期,截止到目前数据库中已存有将近3000个完整的叶绿体基因组序列,这为我们提供了丰富的信息资源,方便进行比较基因组学、系统发育、群体分化、谱系地理等领域的研究。
叶绿体基因组的分析主要分为两个部分:个体分析和群体分析。本篇内容先从单个样本的叶绿体基因组分析开始。
1叶绿体基因组组装
序列组装是叶绿体基因组分析的核心与难点,因为叶绿体基因组相对较小(120~220kb),又相当地保守,后续的分析又都依赖于此,所以对叶绿体基因组拼接的质量要求甚高,必须完整成环并且甚至不允许有一个碱基的错误。
传统叶绿体基因组序列的来源是鉴于叶绿体基因组序列的保守性,设计多对特异性引物进行Long-PCR测序法得到叶绿体基因组序列。但由于叶绿体基因组序列AT含量特别高,引物的有效性并不一定能满足研究的需要,对于没有近缘种的物种更是不好设计引物,同时耗时也较长,且不能保证得到完整的叶绿体基因组圈图。
cpDNA序列的来源可以是全基因组测序序列也可以是分离的叶绿体基因组序列。如果能直接从Total DNA里面分离得到chloroplast DNA再进行测序,这将大大降低信息分析的复杂度。但分离出chloroplast DNA并不是一件容易的事,目前还没有通用的方法,并且已有的方法成本高、难度大、耗时长,且不能广泛应用所有物种。
三代测序技术对基因