基于R和gephi做宏基因组与代谢组等多组学联合network相关性网络图

写在前面

拿到多组学的数据后一直在找合适的方法将二者进行关联,比如我这里是三种体液的代谢组与一种体液的宏基因组。需求是对多组学进行关联分析,直到最近看到不少文章里利用Gephi将相关性表格进行可视化的图,效果还不错,于是写个过程记录自用。这里演示的是属水平的差异菌群相对丰度(宏基因组结果)与代谢组鉴定到的差异代谢物进行关联。

主要分为两个部分:

  • 先是计算相关性生成graphml格式文件
  • 使用Gephi软件进行可视化

数据准备

主要就是两个需要关联的表格

  • 差异代谢物表格
    image-20231011195243243

  • 差异菌属的相对丰度表格
    image-20231011195214637

这里注意:原文件如果是新建的excel,默认有3个sheet,一定记得只保留一个sheet后另存为制表符分隔的txt文件,这一点很重要,不然下面分析的时候会从读取就开始报错!

image-20231011195341323

R包Hmisc计算相关性并用igraph包生成graphml

用到Hmisc包和igraph包

这里就直接放代码吧,遇到相关的报错先仔细检查数据,一般是数据格式和内容本身的问题。不行就上网找解决办法。

###微生物和代谢物的相关性网络
##计算微生物类群丰度和代谢物鉴定强度的相关系数
setwd('F:\\Analysis\\RA_Sanhe cow\\Microgenome\\Network_Gephi module_Pretreat\\RE group\\M_metabolites_genus')
library(Hmisc)
MAG <- read.delim('differ_genus.txt',row.name = 1, check.names = FALSE)
Enzyme <- read.delim('milk_differ_metabolites_inform.txt',row.name = 1, check.names = FALSE)
MAG<-t(MAG)
Enzyme<-t(Enzyme)

#计算群落组成与功能的相关性,以 spearman 相关系数为例
MAG_Enzyme_corr <- rcorr(as.matrix(MAG), as.matrix(Enzyme), type = 'spearman')

#相关系数 r 值和显著性 p 值矩阵
r <- MAG_Enzyme_corr$r
p <- MAG_Enzyme_corr$P

#只保留微生物丰度-功能基因丰度的相关系数
#去除微生物-微生物、功能基因-功能基因之间的相关系数
r <- r[colnames(MAG),colnames(Enzyme)]
p <- p[colnames(MAG),colnames(Enzyme)]

#阈值筛选
#将 spearman 相关系数低于 0.7 的关系剔除,即 r>=0.7
#该模式下,一定要注意负值的选择是否是合适的,因为很多情况下可能负相关无意义
r[abs(r) < 0.7] <- 0

#选取显著性 p 值小于 0.05 的相关系数,即 p<0.05
# p <- p.adjust(p, method = 'BH')    #可选 p 值校正,这里使用 BH 法校正 p 值
p[p>=0.05] <- -1
p[p<0.05 & p>=0] <- 1
p[p==-1] <- 0

#根据上述筛选的 r 值和 p 值保留数据
z <- r * p

#再转换为对称矩阵,igraph 只能识别这种样式的邻接矩阵类型
z1 <- MAG_Enzyme_corr$r
z1[z1 != 0] <- 0
z1[rownames(z),colnames(z)] <- z
z1[colnames(z),rownames(z)] <- t(z)

#write.table(data.frame(z1, check.names = FALSE), 'MAG_Enzyme_corr.matrix.txt', col.names = NA, sep = '\t', quote = FALSE)

##获得网络
library(igraph)

#将邻接矩阵转化为 igraph 网络的邻接列表
#构建含权的无向网络,权重代表了微生物丰度和功能基因丰度间的 spearman 相关系数
g <- graph.adjacency(z1, weighted = TRUE, mode = 'undirected')
g

#孤立节点的删除(删除度为 0 的节点)
g <- delete.vertices(g, names(degree(g)[degree(g) == 0]))

#该模式下,边权重代表了相关系数
#由于权重通常为正值,因此最好取个绝对值,相关系数重新复制一列
E(g)$correlation <- E(g)$weight
E(g)$weight <- abs(E(g)$weight)

#查看网络图
plot(g)

#graphml 格式,可使用 gephi 软件打开并进行可视化编辑
write.graph(g, 'network.graphml', format = 'graphml')

plot包出的图

image-20231011200630160

Gephi软件可视化

下载地址:The Open Graph Viz Platform,支持中文

可参考 B站:Gephi可视化进阶:教你绘制一个漂亮的网络图

进一步对上面生成的network.graphml文件用Gephi可视化

  • 导入图形文件
    在这里插入图片描述

  • 导入后初始布局
    image-20231012091637492

  • 更改布局,等节点的位置没有移动变化即可停止
    在这里插入图片描述

  • 计算平均度与模块化

在这里插入图片描述

  • 模块化上色在这里插入图片描述

  • 调整节点大小
    在这里插入图片描述

  • 添加节点标识,去界面左上角数据资料处替换节点名字
    在这里插入图片描述

  • 预览图,这里根据需要可以自行摸索调整,红框圈出了我调整的部分

image-20231011205821998

  • 导出保存

image-20231011210001552

效果展示

结果图细节修改:在AI中嵌入上面导出的pdf格式结果后补充图例细节即可,下方是效果展示

image-20231012092212749

  • 0
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 全基因组代谢模型指的是通过对一个物种的全部基因组信息,建立数模型来模拟它的代谢系统。这种模型可以用来研究物种的代谢特征,预测它们对外界环境的响应,以及探究它们的生物行为。使用全基因组代谢模型需要对生物知识和数方法有深入的了解,并且需要使用相应的软件工具。 ### 回答2: 全基因组代谢模型模拟是一种利用基因组信息和代谢途径知识来模拟和预测生物的代谢反应网络的方法。该方法可以帮助我们更好地理解和研究生物体内的代谢过程,并为药物设计、代谢工程等领域提供指导。 首先,全基因组代谢模型模拟需要基因组测序数据作为输入。通过获取一个生物体的基因组序列,我们可以获得该生物体所有的基因信息。然后,结合已知的代谢途径和关于基因的功能注释,我们可以构建一个全基因组代谢模型。这个模型包含了所有基因的代谢反应及其相互之间的调节关系。 接下来,通过使用约束来约束代谢模型,我们可以模拟生物体在特定环境条件下的代谢过程。例如,我们可以确定代谢目标,如产生特定代谢产物的最大产量,以及对底物的需求。通过运行模拟,我们可以预测生物体在特定环境下的代谢反应网络,并确定其在不同条件下的最佳生长和代谢途径。 全基因组代谢模型模拟还可以用于药物设计。通过模拟不同药物分子在生物体内的代谢途径,我们可以预测药物的代谢产物和毒性。这有助于筛选和设计更有效和安全的药物分子。 此外,全基因组代谢模型模拟可以用于代谢工程,即通过改造生物体的代谢途径来生产有价值的化合物,如药物、能源或化品。通过模拟和优化代谢反应网络,我们可以提高目标产物的产量和选择性,从而实现代谢工程的目标。 总之,全基因组代谢模型模拟是一种强大的工具,可以帮助我们更好地理解和预测生物体内的代谢过程,同时为药物设计和代谢工程提供指导。它不仅可以提高我们对生物体的认识,还可以促进相关领域的研究和应用的发展。 ### 回答3: 全基因组代谢模型模拟是一种利用大规模基因组数据和代谢网络知识来预测和模拟一个生物体的代谢过程的方法。这种方法可以在系统层面上了解生物体的代谢网络的结构和功能,对于研究代谢网络的生物机制、优化代谢产物的产量以及开发新的代谢工程应用具有重要意义。 全基因组代谢模型模拟的基本过程包括以下几个步骤: 1. 数据收集和预处理:收集相关生物体的基因组数据、代谢通路数据库等信息,并对数据进行清洗和整理,建立准确的代谢网络模型。 2. 代谢网络构建:根据基因组数据和代谢通路数据库中的信息,构建生物体的代谢网络模型。这个模型包含多个代谢通路,以及相应的酶和基因。 3. 代谢通量预测:使用代谢功能基因组技术,预测代谢网络中不同酶和基因的表达量,从而估计代谢通路中各个反应的通量。 4. 代谢产物预测和优化:根据代谢网络模型和代谢通量的预测结果,可以预测生物体在不同环境条件下产生的代谢产物,并通过优化代谢通路中的关键酶和基因来提高目标产物的产量。 5. 模型验证和应用:将模拟的结果与实验数据进行比较,验证模型的准确性,并将模型应用于代谢工程、药物开发等领域。 综上所述,全基因组代谢模型模拟是一种有效的工具,可以帮助我们更好地理解生物体的代谢过程,优化代谢产物的产量,以及开发新的代谢工程应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值