写在前面
最近,自己在绘制进化树的分析,那么自己也总结一下相关的教程吧。对于进化树绘制的教程全网依旧是很多的。自己作为初学者,也是根据这些教程来学习,来做分析。做物种或基因的进化树,软件很多,目前很多可视化的软件都可以实现,功能很强大。
在上期内容中,我们分享了使用HMMER来筛选同源基因,我们获得基因家族后,那么进化树绘制是必须的。这就是文章的套路问题,这些文章,真的是一看就懂,一做就做不出来,唉…
这期教程,我们使用iqtree
+ggtree
来完成进化树的绘制。
iqtree获得树文件
所需软件
-
- mafft
-
- iqtree
mafft安装
我是使用服务器中运行的,安装可以使用conda
- iqtree
conda install mafft
iqtree官网
http://www.iqtree.org/
iqtree功能很强大,大家可以自己软件的官方文档。
安装
conda install iqtree
软件安转好后直接运行即可。
序列准备
进化树序列可以使用蛋白序列或核酸序列即可,格式按其准备即可。
>B2LU34
MTSIAFWNAFTVNPFPAAARRSPPPLTPFTSGALSPARKPRILEISHPRTLPSFRVQAIAEDEWESEKKALKGVVGSVAL
AEDETTGADLVVSDLKKKLIDQLFGTDRGLKATSETRAEVNELITQLEAKNPNPAPTEALSLLNGRWILAYTSFAGLFPL
LGAESLQQLLKVDEISQTIDSEGFTVQNSVRFVGPFSSTSVTTNAKFEVRSPKRVQIKFEEGIIGTPQLTDSIVIPDKFE
FFGQNIDLSPFKGVISSLQDTASSVAKTISSQPPIKFPISNSNAQSWLLTTYLDDELRISRADGGSVFVLIKEGSPLLT
>B4F6G1
MTSIAFCNAFTVNPFLAAARRSPPPLTPLTSVALSPARKPRILAIFHPRTFPSFRVQAIAEDEWESEKKTLKGVVGSVAL
AEDEKTGADLVVSDLKKKLIDQLFGTDRGLKATSETRAEVNELITQLEAKNPNPAPTEALSLLNGKWILAYTSFVGLFPL
LGAESLQQLLKVDEISQTIDSEGFTVQNSVRFVGPFSSTSVTTNAKFEVRSPKRVQIKFEEGIIGTPQLTDSIVIPDKVE
FFGQNIDLSPFKGVISSLQDTASSVAKTISSQPPIKFPISNSNAQSWLLTTYLDDELRISRADGGSVFVLILESSPLLT
>O49629
MATVQLSTQFSCQTRVSISPNSKSISKPPFLVPVTSIIHRPMISTGGIAVSPRRVFKVRATDTGEIGSALLAAEEAIEDV
EETERLKRSLVDSLYGTDRGLSASSETRAEIGDLITQLESKNPTPAPTEALFLLNGKWILAYTSFVNLFPLLSRGIVPLI
KVDEISQTIDSDNFTVQNSVRFAGPLGTNSISTNAKFEIRSPKRVQIKFEQGVIGTPQLTDSIEIPEYVEVLGQKIDLNP
IRGLLTSVQDTASSVARTISSQPPLKFSLPADNAQSWLLTTYLDKDIRISRGDGGSVFVLIKEGSPLLNP
mafft比对
使用mafft将序列对齐。
mafft test.fa > test.aligend.fa
我们获得对齐后的数据格式。
iqtree构建树
iqtree -s test.aligend.fa -m MFP -bnni -nt AUTO -cmax 15 -redo -bb 1000
关于iqtree的使用,可以看这篇教程IQ-TREE的使用 - 超快速用极大似然法构建进化树,讲的很详细。
必须参数:
-s 输入多序列比对文件
-nt 多线程,AUTO是自动多线程
-bb 1000 指定了要用快速BS法做1000次
最终,我们可以获得一下结果文件。
ggtree绘制进化树
这里,我们使用基迪奥的教程,如何绘制添加分类色块的进化树?,这个教程也是讲解得很详细。
注意:我们这里使用iqtree输出文件test.aligend.fa.treefile
作为输入文件。
#载入相关的R包;
library(ggtree)
library(treeio)
library(ggplot2)
#读入newick格式的进化树文件;
tr = read.newick("test.aligend.fa.treefile")
ggtree(tr)
#为进化树添加叶标签;
p1 <- p0 + geom_tiplab(size=2,color="grey10")
p1
#为进化树添加圆形顶点;
p2 <- p0+ geom_tiplab(size=2,offset=0.03, color="grey10")+
geom_tippoint(color="#6bc72b",fill="#6bc72b",
alpha=0.4, size=3,shape=21)
p2
后面的教程参数调整,按着教程即可如何绘制添加分类色块的进化树?
往期文章推荐:
-
- 转录组分析教程
小白学生信 | 转录组上游分析教程
- 转录组分析教程
-
1. 最全WGCNA教程(替换数据即可出全部结果与图形)
- 2. 精美图形绘制教程
话说公众号需要标星,这样公众号的内容你才不会错过。那么,我们也动手标一下吧。
小杜的生信筆記,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!!
本文由mdnice多平台发布