同源性
具有共同进化祖先的序列称为同源序列,同源性是一个二分类指标(定性),要么有,要么没有,没有同源性高和低的说法。同源的序列之间的一致性/相似性一般较高,但是两个一致性/相似性较低的序列依然有可能是同源序列,比如球蛋白家族的成员都是同源序列,但是序列的一致性有高也有低,比如人类的β球蛋白和脑血红蛋白只有22%的氨基酸序列相似性,但是却是同源序列。
同源序列可以被分为直系同源、旁系同源两类。直系同源指的是不同的序列中保存有相同的祖先序列,直系同源序列的形成伴随着新物种的形成,反映了物种的进化历程,直系同源基因一般具有相似的生物学功能,比如人类与大鼠中的肌红蛋白,它们都有在肌肉细胞中运输氧气的功能。
旁系同源指的是处于同一个物种内部的同源基因,旁系同源基因一般是由于基因复制等过程形成的同源基因,在物种内部发生发展。
一致性与相似性
一致性与相似性是一个量化的指标,用来衡量序列之间的相似程度。
序列一致性指的是比对之后,两条序列相同的残基的数量占序列总长度的百分比。
序列相似性百分比指的是序列比对之后,相同的氨基酸和相似的氨基酸的总数占序列总长度的百分比。
一般情况下,会更多的考虑序列一致性的指标,因为不同的算法对相似氨基酸的定义不同。