使用 MENA 和 Gephi 作分子生态网络分析(Molecular Ecological Network Analysis)图

使用 MENA 和 Gephi 作分子生态网络分析(Molecular Ecological Network Analysis)图

简单介绍

生物之间相互作用比如竞争、合作、共生等;由于进化生物之间存在某种系统发育关系,这些联系都能描述为生态网络,在生态网络中,每一个元素(生物或基因)可以描述成网络中的一个节点,他们之间的关系能描述成网络中的边。随着高通量测序、基因芯片等技术的发展,研究人员可以得到了空前庞大的数据量,而利用微生物16S测序数据得到的OTU丰度矩阵也可以进行网络分析,探究不同操作单元之间的互作关系。

什么是MENA

一个可以利用OTU数据进行在线分子生态网络分析的网站。

什么是Gephi

做关系网络图的软件,有可视化页面,基于Java的,不知道没装java能不能用,我之前装了而且配置过环境变量,然后Gephi打开就是能用的。

准备数据

网络分析的输入数据为OTU丰度矩阵,每一行对应一个OTU,每一列对应OTU在不同样品中的丰度,如下图

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-584heqFU-1682576580008)(C:\Users\24121\AppData\Roaming\Typora\typora-user-images\image-20230427091644079.png)]

MENA网站登录和使用

网站地址: http://ieg4.rccc.ou.edu/MENA/

如无账号可以进行注册并登陆,注册只需要邮箱等信息即可。

登陆后界面的主要操作内容为前四部份,涉及上传数据、构建网络、分析网络以及查看此前上传和分析的网络结果。
在这里插入图片描述

上传数据

点击
在这里插入图片描述

选择文件
在这里插入图片描述

然后点击提交

提交成功后会自动显示上传数据的大致信息,包括样本数量、OTU数量等等。

构建网络

点击

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ViAEvGvw-1682576580010)(C:\Users\24121\AppData\Roaming\Typora\typora-user-images\image-20230427092404089.png)]

选择你需要分析的数据集,提交

在这里插入图片描述

跳转到Select Dataset页面,选择需要进行网络分析的数据进行下一步,提交之后进入参数设置页面(如下图),具体涉及了数据过滤,相似性计算算法,RMT(随机矩阵理论)模型计算,提交后跳转至等待页面。

在这里插入图片描述

主界面点击“Search datasets and networks”,可查看当前的工作状态,Status显示为“done”时就可以了。(此步耗时可能比较长)
在这里插入图片描述

点击对应结果

选择一个合适的cutoff作为相似矩阵来构建网络

通常而言,cutoff选择的阈值越高,网络规模(节点数和边数)越小,拟合的R2也高。

多个网络需要比较,保持在同一(或尽可能接近的)cutoff值

在这里插入图片描述

点击提交。随后,将显示最终网络的节点数、边数、平均连通度、平均路径长度、拟合的R2。
在这里插入图片描述

分析网络和导出网络文件

返回主界面点击“Analyze the networks”,可对网络执行以下操作。

9b18dbdeab35116a90bc70eb73ce17f5.png

做完模块计算后。可以点击导出网络文件,下载边文件和节点数据。这在后面的作图中需要。
在这里插入图片描述

在这里插入图片描述

使用Gephi作图

作图的原理是:边文件(edge)给节点之间相连的信息,节点文件(node)补充节点的细节信息,比如rank等。所以边文件是必须的,实际上没有节点文件也能把图做出来,软件也支持导入邻接矩阵文件作图。

MENA导出的数据预处理

因为MENA导出的数据是以分隔符保存的文件,如果用Gephi打开标签不全没法打开,edge文件更是没有属性标签。所以用之前必须先加上,并且另存为Gephi能识别的.lsx文件。这些步骤使用excel就能完成

Excel打开和处理文件

在这里插入图片描述

选择分隔符

在这里插入图片描述

点下一步,选择空格分隔符,完成
在这里插入图片描述

node文件

node节点文件需要补充的属性标签是:

1:ID,(为了和边文件匹配)

2:Label,(作图的时候显示)

我的做法是,把Name复制一列,然后第一列改成ID,第二列改成Label,然后把数据中的无关符号去掉,保留数字。(具体处理方式依照作图需求,这边依照的是老师给的格式,多组处理使用R或python会方便很多)
在这里插入图片描述

结果:
在这里插入图片描述

另存为xlsx文件

edge文件

node节点文件需要补充的属性标签是:

SourceTargetWeightIDType

实际上会发现用同样方法打开edge文件后格式是这样子:

OTU_1(pp)OTU_10=1
OTU_1(pp)OTU_19=1
OTU_1(pp)OTU_23=1
OTU_1(pp)OTU_26=1
OTU_1(pp)OTU_1291=1
OTU_2(pp)OTU_2977=1
OTU_3(pp)OTU_41=1

其中。第一列和第三列和第5列是我们要用的值

分别的意义为:源节点,终结点,和权重

此外,我们还需要加入ID和type(是否有向边)

加上标签后:

SourcexTargetyWeightIDType
OTU_1(pp)OTU_10=10Directed
OTU_1(pp)OTU_19=11Directed
OTU_1(pp)OTU_23=12Directed
OTU_1(pp)OTU_26=13Directed
OTU_1(pp)OTU_1291=14Directed

x和y是随意取的,因为文件是以空格为分隔符的,不能空着。

保存为.xlsx文件

导入node和edge文件

打开Gephi软件

导入边文件:
在这里插入图片描述

点下一步,没用的值就不用勾选了
在这里插入图片描述

点击完成

点击“边”查看:
在这里插入图片描述

再同样导入node文件

注意要加入现有的workspace
在这里插入图片描述

可以看到节点现在有详细数据了

在这里插入图片描述

制图

点击预览(overview):
在这里插入图片描述

拖动左下角使变清晰
在这里插入图片描述

给模块标颜色

因为node文件里面有了MENA分析后的注释信息,包含mudule、degree等,我们下一步的目的就是将这些注释在图上体现出来

在这里插入图片描述

设置颜色

点击apply

在这里插入图片描述

给每个点按照degree设置大小

在这里插入图片描述

我设的是min25,max50: apply:
在这里插入图片描述

设置布局和标签

布局选择Fruchterman Reingold

run后

在这里插入图片描述

概览点击刷新:

在这里插入图片描述

给图加上节点标签:

点击刷新:

最后就可以保存和导出了

由于在计算时过滤条件放宽了,导致节点较为分散

········································································
部分内容参考至CSDN博主「weixin_39532019」的原创文章,
原文链接:https://blog.csdn.net/weixin_39532019/article/details/111686206

  • 19
    点赞
  • 57
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
润色:In the recent years, the world is constantly stricken by various terrifying natural or man-made disasters, all of which calls on our attention to the global sustainable development, defined as the overall coordinating development of nature, society and economy, to meet the current needs without at the cost of the future.\\ Back in 2015, UN Assembly has stipulated the 2030 Agenda for Sustainable Development to address the problem including 17 goals which can be further classified into 5 categories: \textbf{fundamental necessities pursuit} (GOAL 1, 2), \textbf{sustainable social development} (GOAL 3, 4, 5, 6, 7), \textbf{sustainable economic development} (GOAL 8, 9, 10, 11, 12),\textbf{ sustainable ecological development} (GOAL 13, 14, 15) and \textbf{human symbiont pursuit} (GOAL 16, 17). In the article, we mainly discuss the relationships between the SDGs, the priority ranking of SDGs, base on which future implications are given including predicted blue print, ideal achievements and potential goals. Finally the influence of external factors on the structure is researched. In consideration of the priority of each SDG, the point weight is given to each SDG itself, and the edge weight is given to the degree of correlation between SDGs (that is, the degree of influence), to represent the degree of contribution of each SDG to the human-wellbeing. By final calculation, Goal 5,2,1 rank the top3.\\ In future implication, the sliding window model is employed. The predicted blue-print in 10 years is given qualitively and quantitively, and for the ideal achievements we find that fundamental necessities pursuit has a huge impact on the other goals, while human symbiont pursuit influence gradually and sustainable economic development has a general impact too.
02-21
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值