(生物信息学)R语言与统计学入门(二)——单因素方差分析

上次说到t检验,是检验两组数据的均数差异,链接如下:

(生物信息学)R语言与统计学入门(一)——t 检验_李京弦的博客-CSDN博客

这次我们来介绍一下单因素方差分析。

单因素方差分析: 方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验

 简单地说,t检验比较的是两组均数,方差分析比较的就是三组。

在生物信息学中常用于情况呢:比如临床分期,如下图:

 假设我们找到一个基因,想看看这个基因到底好不好,有没有研究的价值,那就需要将它和临床挂钩。在某个癌症中,分期越高,某个基因的表达量越高,说明这个基因很有可能促进肿瘤进展。那么他就有研究意义。如上图,随着分期增高,此基因的表达量增高,且P值有意义。

那么此时,就可以用单因素方差分析,比较三组及以上的均数差异,下面来看单因素方差分析如何实现。

首先准备如下数据:

 这是TCGA数据库某个基因的表达量,以及临床分期,我们将数据提前存成CSV格式。

想要知道该基因对临床分期是否有影响,我们执行以下代码:

setwd("D:\\")
data <- read.csv("Stage.csv",header = T,sep = ",")

aov = aov(data$RBCK1~factor(data$Stage)) ## aov 单因素方差分析的函数
summary(aov)

 可以看到P值没有意义,说明在不同的分期中,RBCK1这个基因的表达量并没有发生改变。

我们还可用那个另一个公式:

oneway.test(data$RBCK1~data$Stage,data)


##
##	One-way analysis of means (not assuming equal variances)

## data:  data$RBCK1 and data$Stage
##  F = 0.33068, num df = 3.000, denom df = 53.886, p-value = 0.8032

也能得到相同的结果。

遇见这种情况,就换基因吧。

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
好的,我会尽力回答你关于SPSS Modeler因素分析的问题。以下是一个案例实践。 案例描述: 一家服装公司想知道不同性别的顾客对其新品牌服装的喜好度是否有显著异。该公司在不同地区随机选取了100名男性和100名女性,并让他们对新品牌服装进行评分。现在,该公司想通过因素分析来确定性别是否对评分产生影响。 实践步骤: 1. 打开SPSS Modeler软件,导入数据集。在“数据准备”节点中,选择“导入数据”并选择数据文件。在“数据文件选项”中选择“首行为变量名”。 2. 在“统计建模”节点中,选择“因素分析”。将数据集连接到“因素分析”节点中。 3. 在“因素分析”节点中,选择因变量和自变量。在本案例中,因变量为评分,自变量为性别。将“性别”变量拖入“因子”框中,“评分”变量拖入“反应”框中。 4. 点击“运行”按钮,进行因素分析。在结果窗口中,可以看到因素分析的结果,包括F值、P值和效应大小等。 结果解释: 根据本案例的结果,F值为17.49,P值为0.0001。因为P值小于0.05,所以我们可以得出结论:性别对评分产生了显著影响。 总结: SPSS Modeler的因素分析功能可以帮助我们确定不同自变量对因变量的影响程度,从而得出科学的结论。在进行因素分析时,需要注意选择合适的因变量和自变量,并对结果进行科学解释。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

楷然教你学生信

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值