摘要
按照正常情况,送去测序的样品最好是同一个批次上机测序,避免外部干扰。最近接到一个项目,拿到手的数据就是分了四批。组长提醒我研究一下批量效应的处理方式。因此,这里总结一下批量处理的分析流程。
环境配置
R版本:3.6.1
依赖R包:limma
使用代码:
library(limma) #调用limma包,线性分析主要包
data <- read.table("all_count.txt",header = T, sep = "\t", row.names = 1) #输入定量后的count值
data <- as.matrix(data) # 转化为矩阵
group <- read.table("group.list",header = T, sep = "\t", row.names = 1) #输入样品对应的批次
batch = group$batch #读取批次列
modcombat = model.matrix(~1,data = group) #生成批次设计矩阵,不懂可以百度model.matrix()函数
all_count_cor <- removeBatchEffect(data, batch = batch ,design = modcombat) #消除