生信豆芽菜-limma差异分析使用说明

最新推荐文章于 2023-10-09 11:30:54 发布

木之如水

最新推荐文章于 2023-10-09 11:30:54 发布

阅读量1.3k

点赞数

文章标签：数据挖掘数据分析 r语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43949246/article/details/132180610

版权

网站：http://www.sxdyc.com/diffLimmaAnalyse
一、limma简介
什么是limma？首先要明白，不管哪种差异分析，其本质都是广义线性模型。 limma也是广义线性模型的一种，其对每个gene的表达量拟合一个线性方程。 limma的分析过程包括ANOVA分析、线性回归等，可以用于RNA-Seq和芯片数据的差异分析表达。这种方法可以对基因表达量拟合一个线性方程，从而得到差异表达的基因，在R语言中有相关的包。
二、使用须知（几个概念）
1、Group:表示的是样本的分组信息。差异分析中，一般只有两组，进行比较，即A和B组进行比较；
2、P值：P值即概率，反映某一事件发生的可能性大小。在差异分析中，p值的大小反应的是分组样本的重复性，组内重复性越好，p值往往越小，在分析的过程中，我们一般认为满足p<0.05的情况下，该特征（基因）差异才是真正的差异基因，而不是由于离群样本过高/过低导致的假阳性结果。
三、使用方法
1.打开网址（http://www.sxdyc.com/singleCollectionTool?href-diff），选择“limma差异分析”
在这里插入图片描述

准备数据
一个全基因的表达谱矩阵，其中行为基因，列为样本

一个样本分组信息，包含两列，第一列为样本名，第二列为分组情况。
在这里插入图片描述

输入“比较的组名”和“被比较的组名”，点击提交
这里输入的是比较组为C1，被比较组为C2，代表该差异分析为C1vsC2

获取到的结果，log2(FC)>0的基因为在C1组中高表达，log2(FC)<0的基因为在C1组中低表达
4.输入分析队列名，点击提交
在这里插入图片描述

5.等待完成，查看结果
在这里插入图片描述

等待结果，查看结果
结果需要注意的是：列名错位，A列其实是基因，B为logFC，C为AveExpr，D为t，E为P.Value，F为adj.P.Val，G为B值

四、结果分析

logFC中的FC即 fold change，表示两样品（组）间表达量的比值，对其取以2为底的对数之后即为logFC。
adj.P.Val即False Discovery Rate，错误发现率，是通过对差异显著性p值（p-value）进行校正得到的。
注意：在自测数据中，由于样本较少，在选择差异分析时，可以选择p值而不是FDR（校正后的p值）
当然，如果不清楚数据是什么样的，可以选择下载我们的示例数据,还可以关注公众号：豆芽数据分析

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
生信豆芽菜-limma差异分析使用说明

limma的分析过程包括ANOVA分析、线性回归等，可以用于RNA-Seq和芯片数据的差异分析表达。在差异分析中，p值的大小反应的是分组样本的重复性，组内重复性越好，p值往往越小，在分析的过程中，我们一般认为满足p0的基因为在C1组中高表达，log2(FC)
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。