- 博客(3)
- 收藏
- 关注
原创 基因家族扩张收缩分析
里面的信息是鉴定出的各物种的基因家族数量,这个还可以导入R里去绘制一个Upset的plot。在利用这个tsv前,我们需要对其进行一些筛选,因为做基因家族的扩张收缩分析使用的软件是CAFE5,对于某些基因家族,如果和其它基因家族之间的数量差距过大,会导致该软件报错,因此需要对过于大的基因家族数量进行过滤,我这里使用的是笨方法,直接对过大的过滤。还需要准备一个文件就是带分化时间的进化树,这个详情请看我的另一个推文,使用前需要稍微处理一下,过滤一下不需要的信息。实际的数量可以根据你的基因家族数量来设定。
2025-10-15 11:12:04
498
原创 利用Orthofinder构建系统发育进化树
新建一个文件夹Angiospermae,在里面准备好需要分析物种的蛋白序列,然后运行orthofinder -t 16 -f Angiospermae/ -S blast,这里建议在分析的蛋白序列做一个可辨识的ID重命名,方便后续的分析。最终得到all.fa,作为下一步的输入,此时的all.fa的命名是乱的,我们需要把每个物种的序列都进行标准的命名,这就是开头建议的原因,如果开头不重命名,在该步骤就会很麻烦。得到的结果导入Figtree可视化即可。然后就可以利用raxml构建进化树。接着预测最佳蛋白模型。
2025-10-15 11:00:00
412
原创 构建带分化时间的系统发育进化树
通过该步骤能得到all.fa.raxml.support文件,这是一个无根树,需要导出到iTOL网站修改为有根树,将构建物种树最长的分支作为根分支,并忽略分支长度,导出。1:seq like;这里面有个坑,带分化时间的插入一定确保要正确,在最后得到结果后可以通过看你自行插入的分化时间是否正确,如果不正确,需要重新run。这里的all.phy是通过一个python脚本转换的,详情见Orthofinder的推文。18代表了物种数,1固定不变,在第二行的树信息中添加了确定的物种分化时间。
2025-10-15 10:48:35
876
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅