edger多组差异性分析_用R实现批量差异分析(t检验和方差分析),自己算P值

最新推荐文章于 2024-07-02 13:57:53 发布

weixin_39705850

最新推荐文章于 2024-07-02 13:57:53 发布

阅读量3.3k

点赞数 1

文章标签： edger多组差异性分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39705850/article/details/111519383

版权

本文介绍了如何在缺乏reads count数据时，利用R进行基因表达的t检验和方差分析。尽管这种方法由于不考虑数据分布，可能导致假阳性，但在必要时仍可使用。文中提供了R代码示例，包括t检验和方差分析的实现，并强调了对于标准差为0的基因行使用NA处理，以及对p值进行FDR校正。最后，提醒读者理解这种方法的局限性并谨慎使用自己计算的P值。

摘要由CSDN通过智能技术生成

对于二代数据的表达差异分析，理论上应该用reads counts进行计算。这个在我们论坛的专题帖已经有解释：

第14期“基因表达量计算和差异表达分析(下)”【视频】

www.omicshare.com/forum/thread-236-1-12.html

同时，在我们OS-tools已经有基于edgeR软件的差异分析工具。但依然有网友问，如果手头没有reads count数据，而只有RPKM/FPKM值该怎么办？

这个时候，就只能退而求其次，使用t检验或者方差分析。但注意，这两种检验是基于正态分布的检验方法，是不适用于二代数据的，对低丰度基因的检验会产生大量假阳性。不到万不得已不要使用这类方法。

如果非使用不可，可以：

使用以下的R脚本进行批量差异检验(t检验或方差分析)；

请将在两组样本中表达量RPKM值均低于1的基因过滤掉(t检验和方差分析在低丰度基因中，假阳性过高，P value不可靠)。

请确定你认真看了上面两点使用建议，再开始看代码。

# t检验的代码如下：

a=read.table(“all_fpkm.txt”,header=T,sep=”\t”)

#预生成2个长度与输入文件行数相同的全为0的向量，将用于存储p value和差异倍数(log2FC)

Pvalue

log2_FC

# 2~4列是处理组1,5~7列是处理组2；

#将使用循环对每一行进行t检验

#如果某一行两组的标准差都等于0，将无法进行t

最低0.47元/天解锁文章

weixin_39705850

关注

1
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。