WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第四步-模块的功能注释)

1写在前面

前面我们用WGCNA分析得到多个模块,其中有一些模块和我们感兴趣的表型或者临床特征是相关的。🥳

接着就是要做模块的富集分析了,帮助我们了解这些模块的基因都有哪些已知的功能,涉及到哪些通路,在哪些疾病中最为重要。🥰

现在这种做富集分析的包还是蛮多的,WGCNA包内也是内置了相关功能,不过首推的还是Y叔clusterProfiler,在我心中真是YYDS。🫶

2用到的包

rm(list = ls())
library(WGCNA)
library(tidyverse)
library(clusterProfiler)
library(enrichplot)
library(org.Mm.eg.db)

3示例数据

load("FemaleLiver-01-dataInput.RData")
load("FemaleLiver-02-networkConstruction-auto.RData")

4整理富集分析的输入文件

一些不会使用代码的小伙伴可以采用将基因列表放到一些在线的网站上去做富集分析,如:👇

  • http://www.metascape.org/
  • http://kobas.cbi.pku.edu.cn/

4.1 整理文件

annot <-  read.csv(file = "./FemaleLiver-Data/GeneAnnotation.csv");
probes <- names(datExpr)
probes2annot <- match(probes, annot$substanceBXH)
allLLIDs <- annot$LocusLinkID[probes2annot];
intModules <- c("brown", "red", "salmon")

4.2 循环输出文件

这里你就可以获得你感兴趣模块的genelist了,去在线网站做富集分析吧。🤠

for (module in intModules){
modGenes <- (moduleColors==module)
modLLIDs <- allLLIDs[modGenes]
fileName <- paste("LocusLinkIDs-", module, ".txt", sep="")
write.table(as.data.frame(modLLIDs), file = fileName, row.names = F, col.names = F)
}

5内置函数进行富集分析

WGCNA包内也内置了分析函数,可以直接调用。😙

5.1 GO富集分析

GOenr <-  GOenrichmentAnalysis(moduleColors, allLLIDs, organism = "mouse", nBestP = 10);

tab <- GOenr$bestPTerms[[4]]$enrichment

names(tab)

write.table(tab, file = "GOEnrichmentTable.csv", sep = ",", quote = TRUE, row.names = FALSE)
alt

5.2 查看结果

keepCols <-  c(1, 2, 5, 6, 7, 12, 13)
screenTab <- tab[, keepCols]
numCols <- c(3, 4)
screenTab[, numCols] <- signif(apply(screenTab[, numCols], 2, as.numeric), 2)
screenTab[, 7] <- substring(screenTab[, 7], 1, 40)
colnames(screenTab) = c("module", "size", "p-val", "Bonf", "nInTerm", "ont", "term name");
rownames(screenTab) = NULL;
options(width=95)
screenTab
alt

6clusterProfiler包进行富集分析

我们再补充一个Y叔的神包clusterProfiler包进行富集分析的方法,也是我个人最推荐的。🥰


6.1 整理输入文件

这里我们假设我们感兴趣的模块是salmon, red, brown, 我们用一下compareCluster函数,将他们都展示在一张图上。🤨

salmon <- allLLIDs[moduleColors == "salmon"] %>% 
na.omit()

red <- allLLIDs[moduleColors == "red"]%>%
na.omit()

brown <- allLLIDs[moduleColors == "brown"]%>%
na.omit()

three_modules <- data.frame(id = c(salmon, red, brown),
modulecolor = rep(c("salmon", "red", "brown"),
c(length(salmon),
length(red),
length(brown))
)
)
DT::datatable(three_modules)
alt

6.2 GO富集分析

其实不光可以做GO富集分析,KEGG, ReactomeGSEA等都是可以的,看大家自己的需求吧。🤩

formula_res.GO <- compareCluster(data = three_modules, 
id~modulecolor,
fun="enrichGO",
OrgDb = 'org.Mm.eg.db')

6.3 dotplot展示富集结果

Y叔写了几种可视化的方式,不做具体介绍了,大家自己喜欢什么样的就弄成什么样吧,颜色也是配成你的心头好就行。😏

dotplot(formula_res.GO)
alt

6.4 cnetplot展示富集结果

这种方式展示也不错,大家可以试试。🤪

cnetplot(formula_res.GO)
alt

7如何引用

📍
Langfelder, P., Horvath, S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics 9, 559 (2008). https://doi.org/10.1186/1471-2105-9-559


alt
最后祝大家早日不卷!~

点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰

📍 往期精彩

📍 🤩 ComplexHeatmap | 颜狗写的高颜值热图代码!
📍 🤥 ComplexHeatmap | 你的热图注释还挤在一起看不清吗!?
📍 🤨 Google | 谷歌翻译崩了我们怎么办!?(附完美解决方案)
📍 🤩 scRNA-seq | 吐血整理的单细胞入门教程
📍 🤣 NetworkD3 | 让我们一起画个动态的桑基图吧~
📍 🤩 RColorBrewer | 再多的配色也能轻松搞定!~
📍 🧐 rms | 批量完成你的线性回归
📍 🤩 CMplot | 完美复刻Nature上的曼哈顿图
📍 🤠 Network | 高颜值动态网络可视化工具
📍 🤗 boxjitter | 完美复刻Nature上的高颜值统计图
📍 🤫 linkET | 完美解决ggcor安装失败方案(附教程)
📍 ......

本文由 mdnice 多平台发布

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值