ggtree实现系统发育树可视化

文章原文:ggtree实现系统发育树可视化

背景1:Newick格式
Newick是最常用的存储进化树的文件格式,如上面这个树,拓朴结构用newick格式可以表示为:

(B,(A,C,E),D);
在这里插入图片描述

括号最外层是根节点,它有三个子节点,B, (A,C,E)和D,而节点(A,C,E)也有三个子节点A,C和E。

加上分支长度,使用 : 来分隔:

(B:6.0,(A:5.0,C:3.0,E:4.0):5.0,D:11.0);

比如A:5.0代表的是A与其父节点的距离是5.0。

内部节点也可以有label,写在相应的括号外面,如下所示:

(B:6.0,(A:5.0,C:3.0,E:4.0)Ancestor1:5.0,D:11.0);

这是最为广泛支持的文件格式,很多进化树可视软件只支持newick格式。

背景2: 如何判断无根树有根树?
假设有下面三种形式的进化树:

[1] (a, b, c); 无根树

[2] (a, b, c):1; 有根树

[3] ((a,b),c); 有根树

如果最外层大括号内只有两个分枝,即为有根树,如[3];

如果最外层大括号内有三个或以上分枝,一般为无根树,如[1];

但是,如果大括号外存在枝长参数,如[2]中的:1,这种情况认为三个分枝以一定的枝长连接到根上,为有根树

ggtree使用

ggtree只映射节点到坐标系统中,而线条在geom_tree图层中计算并画出来。这是与其它软件最根本的不同,也是ggtree能够简单地用图层加注释信息的基础。

1.ggtree安装
if (!requireNamespace(“BiocManager”, quietly = TRUE))

install.packages("BiocManager")

BiocManager::install(“ggtree”)

2.加载包
library(“ggplot2”)

library(“ggtree”)

3. 读取数据
tree=read.tree(“D:/xxx.tre”)

group_file = read.csv(“D:/xx.csv”,header = T, row.names =1) #读取物种group信息文件,注意要与载入的Tree文件的lable相同,否则无法加载分组颜色!

4. 添加分组信息数据至变量
groupInfo <- split(row.names(group_file), group_file$family) # 提取分组信息

tree1 <- groupOTU(tree, groupInfo) #将分组信息赋予给树

ggtree(tree, layout = “circular”)

5. 运行
ggtree(tree, layout = “circular”) #简单

ggtree(tree,layout = “circular”) + geom_tiplab() + geom_point(color=‘firebrick’) #

ggtree(tree1,layout = “circular”) +geom_highlight(node = 1872,fill=“blue “,alpha=0.5)+ geom_highlight(node=1081,fill=” orange”, alpha=0.5)+ geom_highlight(node=1079,fill=" red “)+ geom_cladelabel(node=1872,label=“Pinopsida”,offset=1.2,barsize = 4,color=” blue “)+geom_cladelabel(node=1081,label=“Magnoliopsida”,offset=1.2,barsize = 4,color=” orange",)+geom_cladelabel(node=1079,label=“Ginkgoopsida”,offset=1.2,barsize = 4,color=“red”) #自定义

参考:
G Yu, DK Smith, H Zhu, Y Guan, TTY Lam*.ggtree: an R package for visualization and annotation of phylogenetic treeswith their covariates and other associated data. Methods in Ecology andEvolution. 2017, 8(1):28-36.

使用ggtree实现进化树的可视化和注释(转载)。。作者:余光创。开发过多个R/Bioconductor包,包括ChIPseeker, clusterProfiler, DOSE,ggtree,GOSemSim和ReactomePA. 链接:https://guangchuangyu.github.io/cn/2016/03/ggtree-for-tree-visualization-annotation/

怎样判断newick格式的进化树是有根树,还是无根树?http://blog.sciencenet.cn/blog-656335-926722.html

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

雨林课堂

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值