edger多组差异性分析_简单使用DESeq2/EdgeR做差异分析

最新推荐文章于 2024-07-02 13:57:53 发布

四川华西段伟强

最新推荐文章于 2024-07-02 13:57:53 发布

阅读量2k

点赞数

文章标签： edger多组差异性分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42401338/article/details/112831823

版权

本文对比了DESeq2和EdgeR两种R包在基因差异表达分析中的应用，适用于RNA-Seq等数据。两者处理count data，基于负二项分布，但在离散度估计上有所不同。DESeq2需要整数count数据，而EdgeR可以处理非整数数据。通过设置分组信息、构建对象、估计离散度和筛选差异基因，展示了它们的使用流程。尽管适用于单因素分析，但两者也可扩展到多因素分析。

摘要由CSDN通过智能技术生成

DESeq2和EdgeR都可用于做基因差异表达分析，主要也是用于RNA-Seq数据，同样也可以处理类似的ChIP-Seq,shRNA以及质谱数据。

这两个都属于R包，其相同点在于都是对count data数据进行处理，都是基于负二项分布模型。因此会发现，用两者处理同一组数据，最后在相同阈值下筛选出的大部分基因都是一样的，但是有一部分不同应该是由于其估计离散度的不同方法所导致的。

DESeq2的使用方法：

输入矩阵数据，行名为sample，列名为gene；DESeq2不支持无生物学重复的数据，因此我选择了2个样本，3个生物学重复的数据；并对count data取整(经大神指点，这里需要说明下，我的测试数据readcount是RSEM定量的结果，并不是常见的htseq-count的结果，所以count值会有小数点，而DESeq2包不支持count数有小数点，所以这里需要round取整)。

database_all

设置分组信息以及构建dds对象

condition

使用DESeq函数进行估计离散度，然后进行标准的差异表达分析，得到res对象结果

dds

最后设定阈值，筛选差异基因，导出数据

table(res$padj <0.05)res

EdgeR的使用方法：

跟DESeq2一样，EdgeR输入矩阵数据，行名为sample，列名为gene；DESeq2不支持无生物学重复的数据，因此我选择了2个样本，3个生物学重复的数据。

exprSet_all

设置分组信息，去除低表达量的gene以及做TMM标准化

exprSet 1)>=2,]exprSet

使用qCML(quantile-adjusted conditional maximum likelihood)估计离散度(只针对单因素实验设计)

exprSet

寻找差异gene(这里的exactTest函数还是基于qCML并且只针对单因素实验设计)，然后按照阈值进行筛选即可

et

Summary

以上我主要针对单因素两两比较组进行差异分析，其实DESeq2和EdgeR两个R包都可以对多因素进行差异分析。

DESeq2修改以上代码的分组信息design参数以及在差异分析results函数中添加所选定的分组因素，其他代码基本一样，具体参照DESeq2手册

EdgeR则需要用Cox-Reid profile-adjusted likelihood (CR)方法来估算离散度，y

四川华西段伟强

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。