Cytoscape可视化物种分类树结构
前两天偶然看到了这样一张图,听群友说这是 Cytoscape 调出来的效果,就想试一试。 折腾一番后,发现这个图的工作量貌似蛮大的
。因此本篇就只是概括了一下大致的过程,包括如何准备输入数据,以及在Cytoscape可视化时大致上要点击哪些按钮等,并未仔细琢磨成品图。所以,下文略显粗糙,大家有兴趣就看吧……
这其实是个物种分类树,代表的微生物分类。从高级分类水平(界,细菌和真菌)的根节点开始,依次往低分类层级(门纲目科属等)延伸,逐渐形成分支,末端节点应该是OTU或者种水平。因此,分支呈簇状展示,分支的颜色主要按门水平着色,将衍生自同一类门的微生物分支赋值相同的颜色。节点的大小应该对应了微生物的丰度,而节点的颜色主要有两种,猜测红色代表了一些重要的微生物,白色是不重要的。图中文字部分则标识了主要的微生物门所含的节点数量,以及这些微生物的总丰度占比。
好吧,其实白鱼同学并不知道这是来自哪篇文章的插图,不清楚它的任何细节,包括其具体的指代信息以及作者试图表达的意义等,上一段文字纯粹是看图瞎猜的……又懒得问其来源,那就按照这种理解去模仿吧,反正只是随手画个图嘛,不要在意那么多细节。
准备数据
示例数据和预处理R代码的百度盘链接(提取码,sf9f):
https://pan.baidu.com/s/1nS402FLH3lQu8CNq6JjEsA
网盘附件“otu.txt”如下所示,以OTU的丰度为主,后面跟上这些OTU所属的界门纲目科属分类。需要事先把一些注释不明确的物种提前去除(比如unidentified、unknown、others等),否则导致了一些分类关系混乱。然后将它读到R中,整合各个分类水平的包含关系,即上一级分类和下一级分类的对应列表用作边列表,并统计共计多少分类类型及其丰度用作节点列表。