step3:基因差异分析
#Step3:DEGs
rm(list = ls()) ## 魔幻操作,一键清空~
options(stringsAsFactors = F)
load(file = 'step1-output.Rdata')
# 每次都要检测数据
dat[1:4,1:4]
#table函数,查看group_list中的分组个数
table(group_list)
#通过为每个数据集绘制箱形图,比较数据集中的数据分布
#按照group_list分组画箱线图
boxplot(dat[1,]~group_list)
bp=function(g){ #定义一个函数g,函数为{}里的内容
#加载绘图包
library(ggpubr)
#产生一个数据框,参数是数据框后边的内容
df=data.frame(gene=g,stage=group_list)
p <- ggboxplot(df, x = "stage", y = "gene",
#颜色与背景的设置
color = "stage", palette = "jco",
add = "jitter")
# Add p-value
p + stat_compare_means()
}
bp(dat[1,]) ## 调用上面定义好的函数,避免同样的绘图代码重复多次敲。
bp(dat[2,])
bp(dat[3,])
bp(dat[4,])
dim(dat)
library(limma)
#factor因子:把数据以向量的形式存储
#group_list:生物数据的分组信息
design=mod