细胞器基因组|比较基因组分析助力深度挖掘细胞器进化关系

上一篇文案中我们系统介绍了细胞器基因组结构特点(凌恩生物明星产品:一文读懂细胞器基因组!)。对于细胞器基因组的研究除了可以获得基因组结构、基因构成和GC含量等基本信息以外,同时,由于叶绿体(cpDNA)和线粒体(mtDNA)的基因组保守性,开展近源物种细胞器比较基因组研究,有助于了解基因的功能,表达机理及物种进化,同时可以阐释物种进化关系及基因组的内在结构,目前已经成为细胞器基因组研究趋势。

凌恩生物全面更新比较基因组分析内容,包括基因组共线性分析、系统进化树分析、选择压力分析、叶绿体基因组IR区的扩张与收缩分析以及细胞器基因组片段交流分析等。

1、共线性分析

共线性是指遗传学中的基因连锁关系,是不同物种染色体上同源基因以相同顺序排列的现象。两个物种之间的共线性程度可以作为衡量他们之间进化距离的尺度,可以知道物种间的亲缘关系。对基因组间的局部共线性块进行相似度、重排、倒置等现象的分析可以来阐述物种演化中发生的事件。

图1 叶绿体基因组mVista共线性分析

图2 线粒体基因组共线性分析

2、系统进化树分析

系统发育树(Phylogenetic tree)又称为系统进化树,是用一种类似树状分支的图形来概括各物种之间的亲缘关系,可用来描述物种之间的进化关系。通过系统进化树分析可以找出不同物种间的进化关系,理解祖先序列与其后代之间的关系,同时也可以估算一组共有共同祖先的物种间的分歧时间。

细胞器基因组非常保守,常用来构建系统发育进化树来研究动植物的物种分类和进化地位。凌恩生物构建细胞器系统发生树的方法有以下两种:

(1)基于样品与参考基因组的群体SNP矩阵构建进化树:对于每一个样本,按照相同顺序将所有SNP相连,获得相同长度的fasta格式的序列(其中一个为参考序列),作为输入文件用于进化树构建。

(2)基于Core基因构建进化树:对细胞器基因组鉴定出来的单拷贝Core基因,利用MUSCLE v3.8.31软件进行蛋白多序列的比对,比对结果用于进化树构建。

图3 系统进化树分析

3、选择压力分析

选择压力是指外界施加给某物种生物进化过程中的压力,使得物种适应自然环境。在遗传学中,ω= Ka/Ks或者dN/dS表示的是非同义突变(Ka)和同义突变(Ks)之间的比率。一般认为,同义突变不受自然选择,而非同义突变则受到自然选择作用。通常认为,ω > 1表明有正选择(Positive Selection)效应,即有些有利突变正受到选择;ω = 1不受选择,即中性进化(Neutral Evolution);如果0 < ω < 1,则认为有纯化选择(Negative or Purifying Selection)作用,ω值越小,说明受到的负选择压越大,氨基酸序列越保守。

图4 选择压力分析

4、叶绿体基因组的IR区扩张与收缩

叶绿体基因组IR区指的是叶绿体基因组中2个反向重复区域(IRs)。叶绿体基因组的IR区域被认为是最保守的区域,但其边界区序列可能会向外延伸扩张,也可能向内部收缩,从而导致相关基因拷贝数的变化,或者导致边界区域假基因的产生,这是叶绿体基因组进化中的共有现象,也是其长度变异的主因。

通过IR区的扩张与收缩研究,可以获悉导致相关基因拷贝数的变化,或者导致边界区域假基因的产生,以此来描述造成不同谱系间叶绿体基因组大小差异的原因。

图5 IR区的扩张与收缩 

5、结构变异检测

细胞器基因组进行结构变异检测主要有三种:SNP、InDel和SV。与参考基因组比对,分析近源物种细胞器基因组之间的变异情况,能够更好的对个体或群体进行差异性分析。

SNP(单核苷酸多态性)是指由单个核苷酸的变异所引起的DNA序列多态性。在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在编码基因内,也有可能在非编码序列上,位于编码区内的SNP(coding SNP,cSNP)因其可能影响个体的功能而备受关注。

InDel是DNA序列的插入(Insertion)和缺失(Deletion)现象的总称,狭义的InDel表示1~10bp的短InDel。在基因组编码区域,InDel的发生可能会引起移码突变、氨基酸改变、假基因的出现等等现象。这里分析的是狭义的InDel。

基因组结构变异(SV,Structural Variation)通常是指基因组内DNA片段缺失、插入、重复、倒位、异位。使用MUMmer软件对目标基因组和参考基因组进行比对,再使用LASTZ对区域间进行比对,从区域比对结果中查找SV。

图6 全基因组结构变异类型配对图

6、细胞器片段交流分析

高等植物线粒体和叶绿体之间的片段交流是非常常见的情况,不同物种的线粒体基因组大概会有5%-10%可以在叶绿体基因组找到同源序列。该分析对于探讨叶绿体基因组中水平基因转移的机制以及在植物进化中所起的作用具有重要的意义。

图7 细胞器片段交流分析

凌恩高分客户文献分享

案例一:三种观赏类凤仙花的叶绿体基因组及比较分析 

发表期刊:Frontiers in genetics(IF=4.599)

合作单位:西南林业大学

凤仙花由于其形态特征的冲突和基因组资源的不足,对系统进化和分类鉴定的研究非常有限。凌恩生物客户西南林业大学黄海泉团队在《Frontiers in genetics》的研究论文“Complete Chloroplast Genomes and Comparative Analyses of Three Ornamental Impatiens Species”[1]中对三种观赏类凤仙花叶绿体基因组进行了测序,组装得到的三种凤仙花的叶绿体基因组大小分别为:152,271 bp、151,691 bp和151,953 bp。

对三种观赏物种的叶绿体基因组与之前公布的野生物种基因组进行了比较。研究对它们之间高度相似的基本结构、大小、GC含量、基因数、顺序和功能方面进行了详细比较。研究鉴定了包含高度可变核苷酸热点的突变区域,可用作物种鉴定和分类学的潜在标记。

此外,使用叶绿体全基因组分析凤仙花科物种的系统发育关系,发现它们都是单个进化枝的一部分。这三种表型不同的观赏凤仙花聚集在一起,表明它们很可能是密切相关的。研究进一步确定了凤仙花属中三种栽培物种的系统发育和分类位置。该结果表明叶绿体基因组可用于解决凤仙花属内部或之间的系统发育问题,也为凤仙花科物种的系统学和进化研究提供基因组资源。

图8 三种观赏类凤仙花叶绿体基因组

图9 6个凤仙花科物种叶绿体基因组mVista共线性分析

图10 系统发育进化树分析

案例二:胸孔亚派蟹类线粒体基因组揭示物种系统进化关系

发表期刊:Frontiers in Marine Science(IF=5.084)

合作单位:中国科学院海洋研究所

凌恩客户中科院海洋所沙忠利课题组发表在JCR一区期刊《Frontiers in Marine Science》上的文章“Mitogenomes Provide Insights Into the Evolution of Thoracotremata (Brachyura: Eubrachyura)”[2]在胸孔亚派蟹类系统演化方面获得新进展。

研究首次阐明了豆蟹和珊隐蟹总科的系统进化地位,豆蟹总科形成单系群,位于进化树最基部位置;珊隐蟹总科与沙蟹总科的一支聚为姐妹群,位于较进化的位置。因此,研究提示,共生生活方式或是胸孔亚派的一个祖征,这种生活方式在珊隐蟹中得以保留。研究进一步阐释了沙蟹和方蟹总科内部科的系统进化关系,并建议将沙蟹总科大眼蟹科Macrophthalmidae的霍氏三强蟹Tritodynamia horvathi归入方蟹总科弓蟹科Varunidae。该研究结果对探究胸孔亚派生物多样性,起源演化,生物地理学等具有重要价值。

图11 线粒体基因排序模式以及CO1进化树

图12 胸孔亚派线粒体基因重排的进化过程

图13 胸孔亚派系统进化关系BI(左)和ML(右)

案例三:高分植物线粒体研究:揭示棉花细胞质雄性不育的花粉败育机制

发表期刊:The Crop Journal(IF=4.407)

合作单位:中国农业科学院棉花研究所

凌恩生物客户中国农业科学院棉花研究所邢朝柱研究员团队发表在《The Crop Journal》的研究论文“The cotton mitochondrial chimeric gene orf610a causes male sterility by disturbing the dynamic balance of ATP synthesis and ROS burst”[3]通过棉花不育系(CMS-D2)线粒体基因组de novo组装以及基因组结果分析,首次鉴定出哈克尼西棉胞质不育系(CMS-D2)携带的线粒体不育相关基因orf610a,并初步解析了不育系花粉败育的分子机制。该研究为深入揭示棉花细胞质雄性不育及其育性恢复分子机理奠定基础,对选育棉花优良恢复系和强优势胞质不育“三系”杂交种具有重要指导意义。

图14 细胞质雄性不育(CMS)系ZBA mt基因组圈图

图15 哈克尼西棉细胞质雄性不育系的花粉败育机制

参考文献

[1] Complete Chloroplast Genomes and Comparative Analyses of Three Ornamental Impatiens Species. Frontiers in Genetics, 2022.

[2] Mitogenomes Provide Insights Into the Evolution of Thoracotremata (Brachyura: Eubrachyura). Frontiers in Marine Science. 2022.

[3] The cotton mitochondrial chimeric gene orf610a causes male sterility by disturbing the dynamic balance of ATP synthesis and ROS burst. The Crop Journal, 2022.

往期精彩

凌恩生物明星产品:一文读懂细胞器基因组!

胸孔亚派蟹类线粒体基因组揭示物种系统进化关系

线粒体比较基因组揭示两种药用牛蒡差异

线粒体基因组|Contracaecum sp.的鉴定和遗传特征

叶绿体基因组|两种姜黄叶绿体比较基因组分析

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SHANGHAILINGEN

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值