多线程循环跑wgcna 选最佳参数

刘融晨

已于 2024-01-05 21:35:19 修改

阅读量520

点赞数 7

分类专栏： wgcna多循环分析文章标签： r语言

于 2024-01-05 20:32:47 首次发布

本文链接：https://blog.csdn.net/m0_73361516/article/details/135417514

版权

wgcna多循环分析专栏收录该内容

1 篇文章 0 订阅

订阅专栏

上图是我用256核服务器跑wgcna的情况,以下代码可以发挥所有性能

library(WGCNA)
library(tidyverse)
library(foreach)
library(doParallel)
# 加载数据和库
load(file = "./wgcna.RData")
allowWGCNAThreads(nThreads = 64)
enableWGCNAThreads(nThreads = 64)    #电脑可以多线程运行
# 设置并行计算环境
cl <- makeCluster(64) # 根据实际情况选择较小的核心数
registerDoParallel(cl)

results <- foreach(l = c(10,20,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,600,800),
                   .packages = c("WGCNA", "tidyverse"),
                   .combine = rbind) %dopar% {
  
  Minnum <- l
  res2 = data.frame()
  for ( i in c(0.05,0.1,0.15,0.20,0.25,0.3,0.35,0.4)) {
    CutHeight  = i
    for (m in 0:4) {
      Split = m
      
      net <- blockwiseModules(
        # 0.输入数据（表达矩阵）
        datExpr, 
        
        # 1. 计算相关系数 （基因与基因之间的数据，是连续型选p）
        corType = "pearson", # 相关系数算法，pearson|bicor
        
        # 2. 计算邻接矩阵
        power = 21, # 前面得到的 soft power
        networkType = "unsigned", # unsigned | signed | signed hybrid
        
        # 3. 计算 TOM 矩阵 （生成TOM的距离矩阵）
        TOMType = "unsigned", # none | unsigned | signed
        saveTOMs = TRUE,
        saveTOMFileBase = "blockwiseTOM",
        
        # 4. 聚类并划分模块
        deepSplit = Split, # 0|1|2|3|4, 值越大得到的模块就越多越小
        minModuleSize = Minnum,  #模块里面最少有多少基因
        
        # 5. 合并相似模块
        ## 5.1 计算模块特征向量（module eigengenes， MEs），即 PC1
        ## 5.2 计算 MEs 与 datTrait 之间的相关性
        ## 5.3 对距离小于 mergeCutHeight （1-cor）的模块进行合并
        mergeCutHeight = CutHeight,   #模块与模块之间相关性>0.75将两个模块合并
        
        # 其他参数
        numericLabels = FALSE, # 是否以数字命名模块
        nThreads = 0, # 0 则使用所有可用线程
        maxBlockSize = 100000 # 需要大于基因的数目
      )
      
      wgcna_result <- data.frame(gene_id = names(net$colors),
                                 module = net$colors) 
      
      moduleTraitCor <- cor(
        net$MEs,  ##ME指模块特征向量
        datTraits$size %>% 
          str_replace_all("S","1") %>% 
          str_replace_all("B","2") %>% 
          as.numeric(), #样本信息表
        use = "p",
        method = 'kendall' # 注意相关系数计算方式
      )
      
      moduleTraitCor = moduleTraitCor %>%
        as.data.frame() %>%
        rownames_to_column(var = "module")
      
      moduleTraitCor <- moduleTraitCor[order(abs(moduleTraitCor$V1), decreasing = TRUE), ]
      
      my_modules <- c(moduleTraitCor[1,1] %>% str_replace_all("ME","")) 
      # 提取该模块的表达矩阵
      m_wgcna_result <- filter(wgcna_result, module %in% my_modules)
      m_datExpr <- datExpr[, m_wgcna_result$gene_id]
      
      m_datExpr = m_datExpr %>% as.data.frame() %>% t()%>% 
        as.data.frame() %>% rownames_to_column(var = "gene_id")
      
      cor = moduleTraitCor$V1[1]
      
      res = data.frame(deepSplit = Split,
                       minModuleSize = Minnum,
                       mergeCutHeight = CutHeight,
                       module_num,
                       cor)
      res$deepSplit = res$deepSplit %>% as.character()
      res$minModuleSize = res$minModuleSize %>% as.character()
      res$mergeCutHeight = res$mergeCutHeight %>% as.character()
      res$module_num = res$module_num %>% as.character()
      res$cor =res$cor %>% as.character()
      
      res2 = res2 %>% bind_rows(res)
    }
  }

  return(res2)
}
# 停止集群
stopCluster(cl)
write_csv(results %>% as.data.frame(),file = "./wgcna_cycle2.csv")