R语言学习笔记:方差分析

1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响

正态假设条件:W检验

shapiro.test():原假设为数据来自正态分布

方差齐性条件:Bartlett检验(主要用于正态分布的数据)

 

bartlett.test(x, g, ...)

x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。

 

当使用数据集时,也可以通过formula调用函数

 

bartlett.test(formula, data, subset, na.action, ...)

formula是形如lhs~rhs的方差分析公式;data是数据集;subset指定观测值的子集用于分析;na.action表示对缺失值进行的行为

 

Levene检验(可用于正态分布,也用于非正态,较稳健)

levene.test():car包
 

 

levene.test(x,group)

x是数据向量,group是因子向量

 

单因素方差分析:目的是比较在因素A的r个水平下,实验结果是否有明显差异

aov():

 

aov(formula, data = NULL, projections = FALSE, qr = TRUE, contrasts = NULL, ...)

formula表示方差分析的公式,单因素中为x~A;data表示数据框;projections逻辑值,表示是否返回预测结果;qr表示是否返回qr分解结果;contrasts是公式中的一些因子的对比列表

 

oneway.test():

 

oneway.test(formula, data, subset, na.action, var.equal = FALSE)

若各水平下总体方差相等,则设置var.equal=TRUE,结果同aov()。默认方差不等,采用Welch近似方法。

 

也可以用lm()计算,然后使用anova()提取计算结果:anova(lm(formula))

多重t检验:检验两两水平下的样本之间的差异是否明显

pairwise.t.test():

 

pairwise.t.test(x, g, p.adjust.method=p.adjust.methods, pool.sd=!paired,paired=FALSE,alternative = c("two.sided","less","greater"),...)

x是响应向量;g是因子向量;p.adjust.method给出P值的修正方法,默认为Holm,当多重检验次数较多时,推荐使用"bonferroni";paired为逻辑值,指示是否配对t检验;alternative指明检验的方向

 

秩和检验:采用秩样本进行比较,可以摆脱总体分布的束缚,不需要满足正态性和方差齐性,比较两个以上总体

krustal.test():

 

krustal.test(x,...)
krustal.test(x,g,...)
krustal.test(formula, data, subset, na.action, ...)

x是数据的向量或列表;g是由因子构成的向量,当x是列表时忽略g;formula是方差分析的公式;data是数据框;subset指定子集;na.action指定遇到缺失值的处理方法

 

双因素方差分析:只需将公式中的x~A改为x~A+B(无交互)或x~A*B(有交互),仍用aov()

生成因子水平:gl()

 

gl(n, k, length= n*k, labels = 1:n, ordered = FALSE)

n是因子的水平个数;k表示每一水平上重复的次数;labels对因子的不同水平添加标签;ordered为逻辑值,指示是否排序

 

绘制交互效应图:

interaction.plot()

 

interaction(x.factor, trace.factor, response, fun = mean, type = c("l","p","b","o","c"),legend=TRUE,trace.label = deparse(substitute(trace.factor)),...)

x.factor表示横轴的因子;trace.factor表示分类绘图的因子;response是数值向量,要输入响应变量;fun表示汇总数据的方式,默认为计算每个因子水平下的均值;type指定图形类型;legend是逻辑值,表示是否生成图例;trace.label给出图例中的标签

 

协方差分析: 实验个体初始条件不同,考虑这些不可控的因素的方差分析

ancova():HH包

 

ancova(formula, data.in = NULL, ..., x, groups)

formula指定模型;data.in指定输入数据框;x为协方差分析中的协变量,在作图时如果formula中不包括x则需要指明;groups指明绘图时分组的条件因子,当formula中的“|”后面不包括变量时使用


 

 





 

 

 

 

 

 


 

 

 

 

  • 5
    点赞
  • 52
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
R语言实战笔记第九章介绍了方差分析的内容。方差分析是一种用于比较两个或多个组之间差异的统计方法。在R语言中,可以使用lm函数进行方差分析的回归拟合。lm函数的基本用法是: myfit <- lm(I(Y^(a))~x I(x^2) I(log(x)) var ... [-1],data=dataframe 其中,Y代表因变量,x代表自变量,a代表指数,var代表其他可能对模型有影响的变量。lm函数可以拟合回归模型并提供相关分析结果。 在方差分析中,还需要进行数据诊断,以确保模型的可靠性。其中几个重要的诊断包括异常观测值、离群点和高杠杆值点。异常观测值对于回归分析来说非常重要,可以通过Q-Q图和outlierTest函数来检测。离群点在Q-Q图中表示落在置信区间之外的点,需要删除后重新拟合并再次进行显著性检验。高杠杆值点是指在自变量因子空间中的离群点,可以通过帽子统计量来识别。一般来说,帽子统计量高于均值的2到3倍即可标记为高杠杆值点。 此外,方差分析还需要关注正态性。可以使用car包的qqplot函数绘制Q-Q图,并通过线的位置来判断数据是否服从正态分布。落在置信区间内为优,落在置信区间之外为异常点,需要进行处理。还可以通过绘制学生化残差的直方图和密度图来评估正态性。 综上所述,R语言实战第九章介绍了方差分析及其相关的数据诊断方法,包括异常观测值、离群点、高杠杆值点和正态性检验。这些方法可以用于分析数据的可靠性和模型的适应性。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [R语言实战笔记--第八章 OLS回归分析](https://blog.csdn.net/gdyflxw/article/details/53870535)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值