直系同源预测方法

直系同源预测方法

直系同源的基因通常具有相似的生物学功能,所以我们在进行一个未知序列的功能的鉴定的时候,其实质在找功能已知的同源基因。功能基因组的研究过程中,对于两个或者多个物种的同源基因进行鉴定,是功能基因鉴定、比较基因组、功能基因分类、pathway预测等待的基础。

基因相似性、一致性与同源性

  • 同源性是序列同源或者不同源的一种论断,而一致性和相似性是一种描述序列相关性的量;
  • 如果两条序列有一个共同的进化祖先,那么他们就是同源的,不存在同源性的程度问题,要么同源,要么不同源;
  • 同源蛋白总是在三维结构上有显著的相似性;
  • 两条蛋白即使没有统计上显著的一致性,其也可能是同源的;
  • 两条蛋白质是否同源的最强的证据来自于结构研究和进化分析;
  • 一致性(identity)表示了两个序列相同的程度;
  • 两条序列的相似性百分比(percent similarity)是相等于相似匹配之和;
  • 一般的一致性比相似性更有用些,因为相似性的衡量依赖于如何定义两个氨基酸残基是如何相似的;
  • 双序列的比对是排列两条序列以达到最大程度相同的过程,其目的是衡量两个分子的相似性和同源的可能性;

确定两个蛋白是否同源的问题检查单

  • 期望值是否显著?
  • 两个蛋白质是否有近似的大小?
  • 是否具有共同的模体或信号序列?
  • 多序列比对的融合性?
  • 是否具有相似的分子特性?
  • 是否具有相似的三维结构?
  • 双向blast比对结构是否一致?
  • 是否具有相似的生物学功能?

直系同源与旁系同源

  • 同源的蛋白质可以分为直系同源与旁系同源,当同源是基因复制的结果,两份拷贝在一个物种的历史上是平行演化的,这样的基因被称为旁系同源基因。当同源是物种形成的结果,基因的历史反映了物种的历史,被称为直系同源;
  • 直系同源是不同物种内的同源序列,他们是来自于物种形成时的共同祖先基因;
  • 通常认为直系同源的序列具有相似的生物学功能;

直系同源与旁系同源的区分

判断直系同源还是旁系同源主要依据最大似然法构建的基因系统发育树。 系统发育树可以显示出基因家族演化的历史,比如基因从一个共同的祖先中分化的。基因树同物种树进行比对,是否有内部的节点,将是区别复制事件与物种分化事件的依据。如果只是简单的只有唯一的直系同源基因,这样的验证非常容易区别。但是大多数情况都是一对多或者多对多的关系。比如斑马鱼与哺乳动物的同源基因比较中这种情况非常多,在果蝇与哺乳动物或者蠕虫与哺乳动物的同源基因预测中,这中情况更为明显。

鉴定直系同源基因的方法,分为7步:

  1. 从Ensemble下载要比对物种的所有基因的蛋白质序列,如果一个基因有多个转录本,只取最长的;
  2. 使用WUBlastp+SmithWaterman,每个基因同所有的基因进行比对,也就是将所有物种的基因当做一个库,用这个库和其本身进行比对;
  3. 基于BRH与BSR的值,为这些基因建立关系图;
  4. 将有关联的分为一组,相当于一个基因家族;
  5. 对于每一组,将蛋白质序列用MUSCLE进行多重比对;
  6. 对比好的每一组,使用多重比对结果中蛋白质对应的CDS序列,使用NJTREE构建系统发育树;
  7. 针对每个基因树,推断每两个基因是直系同源还是旁系同源:

Orthologues : 两个基因之间的根节点是一个物种形成事件,直系同源的几种情况

  • ortholog_one2one 一对一
  • ortholog_one2many 一对多
  • ortholog_many2many 多对多
  • apparent_ortholog_one2one (is a special case, see below) 明显的一对一

Paralogues : 祖先节点是一个复制事件,旁系同源的集中情况:

  • within_species_paralog 物种内的
  • between_species_paralog 物种间的

简单的基因同源性的门槛(基于Blastp比对的)

  • identity >30%;
  • e-value <1e-10;
  • score>200
  • overlap >60%

同源基因数据库

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于直系同源基因的物种树构建是一种常用的系统发育分析方法。其基本思路是选取多个物种中的同源基因,通过比对这些基因的序列差异,推断物种之间的进化关系。下面是一些基于直系同源基因构建物种树的步骤: 1. 选取同源基因:首先从多个物种中选取同源基因。这些基因应具有以下特点:在不同物种中具有高度保守性,长度适中,且缺失较少。 2. 序列比对:对选定的同源基因进行序列比对,找出它们之间的差异,并记录下来。 3. 构建进化距离矩阵:根据同源基因比对结果,计算不同物种之间的进化距离,并将其记录在一个进化距离矩阵中。 4. 构建系统发育树:根据进化距离矩阵,使用系统发育树构建软件,如MEGA、PAUP等,构建物种树。其中,系统发育树构建软件可以采用不同的算法,如最小进化距离法、最大简约法、最大似然法等,以得到不同的系统发育树。 5. 验证树的可靠性:对于构建出来的物种树,需要进行可靠性验证。这可以通过Bootstrap方法、Jackknife方法等进行,以评估树的可靠性和稳定性。 以上是基于直系同源基因构建物种树的一些基本步骤。需要注意的是,选取同源基因时要注意确保其确实是同源基因,避免选择到伪基因或拷贝基因等。此外,不同算法和软件对于物种树的构建结果可能会有所不同,因此需要进行多次构建和验证,以得到可靠的结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值