目录
前言
clusterProfile是常用的基因富集分析的包,之前已经介绍过了对但样本集合进行富集分析的操作。本次我们尝试一下使用包中的compareCluster函数对多个样本进行富集分析,并使用气泡图进行展示。
提示:以下是本篇文章正文内容,下面案例可供参考
一、compareCluster函数
这个函数是clusterProfile中自带的函数,可以对多个基因集分别进行基因富集分析,并使用使用气泡图进行可视化,方便比较。
二、使用步骤
1.加载包
代码如下(示例):
library(clusterProfiler)
library(org.Hs.eg.db)
library(stringr)
library(dplyr)
library(tibble)
library(tidyr)
2.读入数据
有两个文件,一个是数据文件,一个是病人分组
mutation <- read.csv('mutation.xls',header = T,sep = '\t')
mutation <- mutation[,c("Gene_refGene","patient","sampleID")]
> head(mutation)
Gene_refGene patient sampleID
1 ARID1A S01001 S01001_EOT
2 FLT3 S01001 S01001_EOT
3 RB1 S01001 S01001_EOT
4 RB1 S01001 S01001_EOT
5 ARAF S01001 S01001_EOT
6 ERBB2 S01001 S01001_C1
patient_information <- read.csv("panient_information.csv",header = T)
> head(patient_information)
patient siteBestResponse SD.24wk C1有无血
1 01001 PD NA NA
2 01002 PR NA 0
3 01003 SD 1 NA
4 01004 PR NA 0
5 01006 PR NA 0
6 01007 PR NA NA
3.处理数据数据
我们的表格是不符合compareCluster的要求的,所以需要处理一下
colnames(patient_information)[1] <- 'patient' ##修改指定列名
colnames(mutation)[1] <- 'gene' #修改mutation第一列列名为gene
mutation$patient <- str_replace(mutation$patient, "S",&