关于基因差异化的那些事 edger Deseq2和limma的使用及一些总结

本文介绍了在基因差异分析中常用的R包limma, edgeR和DESeq2,重点讲解了limma包的适用场景、数据处理方式以及从FPKM到TPM的转换过程。通过对数据的读入、处理和转换,使用limma进行差异分析,展示了线性建模和经验贝叶斯统计在差异基因鉴定中的应用。" 135870971,9443987,AI图像生成:文心一言与SDXL的创意碰撞,"['人工智能', '图像生成', '大语言模型', '计算机视觉', '文心一言']
摘要由CSDN通过智能技术生成

在基因差异分析的过程中常见的几大差异化常用的R包 主要是edgeR Deseq2 和limma(其中limma 包主要内置于edgeR)
那么在分析的过程中呢,每个包有他们各自的一些数据处理方式。
在接受的数据格式上和样本数目上呢也存在一些差异。主要如下

在这里插入图片描述
1.首先关于limma 包进行差异分析
参考的博客主要有
https://cloud.tencent.com/developer/article/1667505(R包limma作差异基因分析)

关于limma 包的一些相关知识
limma 主要用于分析来自芯片的基因表达数据或来自RNA-Seq 的基因表达数据,其中最主要的功能是通过使用线形模型来评估多因子实验的差异表达,limma 主要用于小样本量的数据的差异化分析,其尤其为多实验条件变量和预测因素的复杂实验而设计,这种线性的模型和差异化分析的方式,使得它广泛的应用于芯片,RNA-seq 和定量PCR的数据,limma 可用于单通道和双色芯片通道芯片的差异化分析。
通过将log2-counts per million(Log CPM),估计均值-方差(Mean-variance)关系以确定在线形建模之前每次观察的权重,之后将数据应用于线性建模,并通过经验贝叶斯统计差异基因。

R包的安装

BiocManager::install('limma')
 
library(limma)

2.limma 差异分析的数据准备

2.1 数据读入和处理

今天我们准备的数据是一个从GEO上下载下来的FPKM 数据

首先通过read.table ()函数,将下载的压缩包的文件进行读取
exprset <- read.table(file = 'GSE130437_genes.fpkm_table.txt.gz',
                      sep = '\t',
                      header = T,
                      quote = '',
                      fill = T, 
                      comme
  • 4
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值