利用单拷贝直系同源基因进行构树

1.什么是单拷贝直系同源基因?

单拷贝,即指物种内具有行使相似功能的基因只有一个;直系同源,即指不同物种间具有行使形似功能、序列一致度较高的基因;合起来就是物种间具有相似功能,一致度较高的唯一的基因。举个例子,假设物种A中的基因A可以合成叶绿素,而物种B中的基因B也可以合成叶绿素,两者序列比对有较高的一致度,如果行使功能的基因A和基因B在物种A和物种B中是唯一的,没有其他基因可以取代它们的功能和没有高的同源性,那基因A和基因B就是单拷贝直系同源基因。

直系同源(Orthologs)是指来自于不同物种的由垂直家系,也就是物种形成,进化而来的基因,并且典型的保留与原始基因相同的功能。也就是说,随着进化分支,一个基因进入了不同的物种,并保留了原有功能。这时,不同物种中的这个基因就属于直系同源。

旁系同源(Paralogs)是指在同一物种中的来源于基因复制的基因,可能会进化出新的但与原功能相关的功能来。

2.单拷贝直系同源基因构建进化树的主要步骤如下。

1. 准备好不同物种的序列文件,预测基因组的蛋白序列 prodigal (已知蛋白序列不用)

2. 单拷贝同源基因搜索 orthofinder

用于分析物种基因组中的单拷贝同源基因

使用命令:orthofinder -t 4 -a 2

分析结果的序列ID重新命名一下,可以用seqkit、TBtools等软件批量操作实现。

3. 拼接 将每个物种的单拷贝直系同源基因拼接成一条新的基因序列

可以用Rstudio、seqkit等软件进行操作,当然或许你有更简便的方法实现拼接。

4. 序列比对 mafft

使用命令:mafft --auto --thread 2 --quiet

5. 修剪 trimal 保留比对结果中的保守区域

使用命令--automated1

6. 建树 iq-tree 用于构建系统发育树,也可以用贝叶斯法建树。

使用命令:-st AA -m MFP -nt 4 -bb 5000 -bnni -pre supergene.iqtree -redo

注:以上大部分分析软件都是Linux系统的。倘若分析的物种数量多且基因组数据又大,则分析过程需要消耗的时间和内存也相应更多,需要等待的时间也更长。

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
基于直系同源基因的物种构建是一种常用的系统发育分析方法。其基本思路是选取多个物种中的同源基因,通过比对这些基因的序列差异,推断物种之间的进化关系。下面是一些基于直系同源基因构建物种的步骤: 1. 选取同源基因:首先从多个物种中选取同源基因。这些基因应具有以下特点:在不同物种中具有高度保守性,长度适中,且缺失较少。 2. 序列比对:对选定的同源基因进行序列比对,找出它们之间的差异,并记录下来。 3. 构建进化距离矩阵:根据同源基因比对结果,计算不同物种之间的进化距离,并将其记录在一个进化距离矩阵中。 4. 构建系统发育:根据进化距离矩阵,使用系统发育构建软件,如MEGA、PAUP等,构建物种。其中,系统发育构建软件可以采用不同的算法,如最小进化距离法、最大简约法、最大似然法等,以得到不同的系统发育。 5. 验证的可靠性:对于构建出来的物种,需要进行可靠性验证。这可以通过Bootstrap方法、Jackknife方法进行,以评估的可靠性和稳定性。 以上是基于直系同源基因构建物种的一些基本步骤。需要注意的是,选取同源基因时要注意确保其确实是同源基因,避免选择到伪基因拷贝基因等。此外,不同算法和软件对于物种构建结果可能会有所不同,因此需要进行多次构建和验证,以得到可靠的结果。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值