一行命令完成RNAseq差异分析+画图

本文介绍了如何通过一行命令完成RNAseq数据的差异分析,包括火山图和散点图的绘制。首先,需要准备基因表达count、FPKM和样本分组文件。接着,在确保安装了R和相关R包后,运行提供的R脚本。通过RStudio或DOS/Linux命令行执行脚本,最终得到差异分析结果文件和可视化图表,简化了数据分析流程。
摘要由CSDN通过智能技术生成

今天来给大家分享的是:怎么一行命令完成RNAseq数据差异分析+火山图+散点图。

一、准备3个文件:

1、基因表达count文件:gene_count.txt 格式如下:(行是基因、列是样本)

在这里插入图片描述
2、基因表达FPKM文件:gene_exp.txt

在这里插入图片描述
3、样本分组文件:group.txt(第一列是样本、第二列是分组名)
在这里插入图片描述
二、运行代码

1、确保已经安装了R或RStudio,如果没有安装R包edgeR和ggplot2,可以先安装一下。这里使用edgeR包的exactTest函数进行RNAseq的差异分析。

安装R包代码:

if (!requireNamespace("BiocManager")) install.packages("BiocManager")
BiocManager::install(c('edgeR'))
install.packages("ggplot2")

R包已经装好的忽略上面步骤,直接复制下面代码,另存为 edgeR.R。

library(edgeR)library(ggplot2)#读取文件data <- read.table("gene_count.txt",sep="\t",row.names=1,header=TRUE)
group0 <- read.table("group.txt",sep="\t",row.names=1,header=TRUE,as.is = TRUE)
exp <- read.table('gene_exp.txt', sep = '\t', row.names = 1,header=TRUE)
group <- group0[,'group']
dgelist <- DGEList(counts = data, group = group)
#过滤低表达,CPM标准化
keep <- rowSums(cpm(dgelist) > 1 ) >= 2
dgelist <- dgelist[keep, keep.lib.sizes = FALSE]
#TMM 标准化
dgelist<- calcNormFactors(dgelist, method = 'TMM')
#估算离散值
dgelist = estimateCommonDisp(dgelist)
dgelist = estimateTagwiseDisp(dgelist)
dgelist = exactTest(dgelist)
tTag = topTags(dgelist,n=NULL)
tTag <- as.data.frame(tTag)
g1 <- unique(group)[1]
g2 <- unique(group)
  • 9
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值