为何要序列联配?相似与同源的区别在哪里?
播报文章
2021-05-05 16:54
关注
构建系统发育树最基本的前提是所使用的序列需均为同源序列。
1. 序列联配(Alignment)的目的:
所有的建树方法都假设一组同源序列内任意一列中的所有碱基也都是同源的(即都是起源于祖先序列中相同位置的碱基)。若没有插入和突变(统称为:indels),那么两条序列是一样长的,且从头到尾每个碱基都是同源匹配的。
但实际上插入缺失是确实存在的,这会改变序列长度,移动碱基的位置,且会影响氨基酸的序列。然而,序列比对(Alignment)就是在序列中引入缺口的过程,其目的是为了将碱基移动到他们相应的同源位置上。这个过程十分重要,决定了构建的系统发育树的质量。
图片来源网络
2. 同源性与相似性的差别(非常重要):
构建系统发育树过程中一定要将同源性和相似性区分开。
“同源”意味着两类群或两序列是来自同一个祖先的后代,在序列联配时(Alignment)同源位点的碱基相同是因为遗传关系所导致的。
然而,“相似性”仅仅是反映出部分位点的性状状态是相同的。如两条非同源序列也可以进行联配,有些部位的碱基也会完全相同(这就是为什么我们在网上blast自己手中的基因序列时,其结果中往往会出现一些匹配度很高的其它基因),但这种碱基相同并不是由于同一个祖先遗传的结果。
显然,无论两条序列有多么相似,把两个非同源的序列放在同一棵树上是没有意义的(因建树的目的就是显示源自共同祖先的遗传演化过程)。
目前,在一些发表的论文中也会出现包含非同源序列的系统树,如一组蛋白酶因具有相似的催化属性和反应机制,而被赋予相同的名称并不罕见,随后它们会被置于同一棵系统树中,而不管其是否同源。