DESeq2包分析差异表达基因

本文介绍了如何利用DESeq2包进行高通量测序数据的基因差异表达分析。首先,读取基因表达谱数据并进行预处理;然后,创建DESeqDataSet对象,设置样本分类;最后,执行DESeq分析,筛选差异表达基因,并输出结果文件。DESeq函数包含了大小因素估计、方差估计和负二项式GLM拟合等步骤。
摘要由CSDN通过智能技术生成

DESeq2:基于负二项式模型的高通量测序数据基因差异表达分析。

1. 读入基因表达谱数据

# if (!requireNamespace("BiocManager", quietly = TRUE))
#   install.packages("BiocManager")
# 
# BiocManager::install("DESeq2")

# setwd(work_dir)
# count_df <- read.csv(file,row.names = 1)

count_df <- round(count_df) # 如果有小数
dim(count_df)
count_df[1:3,1:4]

2.  生成DESeqDataSet 对象

library(DESeq2)

# 样本分类
condition <- factor(c(rep("control",50),rep("treat",63))) # mock
colData <- data.frame(row.names=colnames(count_df), condition)

dds <-DESeqDataSetFromMatrix(countData = as.matrix(count_df),
                             colData = colData,
                             design= ~condition)
head(dds)

注:DESeqDataSet(),DESeqDataSetFromMatrix(),DESeqDataSetFromHTSeqCount()  都能生成DESeqDataSet 对象

3. 差异表达基因分析

dds <- DESeq(dds)

res <- results(dds)
summary(res)
head(res)

resOdered <- res[order(res$padj),]
deg <- as.data.frame(resOdered)
#deg <- na.omit(deg)
dim(deg)

write.csv(deg,file= "diff_deseq2.csv")

DESeq函数包含三步,estimation of size factors(estimateSizeFactors), estimation of dispersion(estimateDispersons), Negative Binomial GLM fitting and Wald statistics(nbinomWaldTest) 返回DESeqResults 对象。

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值