R语言
语言学与R语言的碰撞
Xu & Yang
PhoneticSan
学习参考
Discovering Statistics Using R
Statistics for Linguistics with R
How to Do Linguistics with R
R in Action
Analyzing Linguistic Data
R Graphics Cookbook
··· ···
Recap
进行线性回归需要满足三个前提假设:线性、残差正态性、残差的方差齐性。其中方差齐性检验可使用car包中的ncvTest( )函数或spreadLevelPlot( )函数。
两个以上的预测变量使用的方法叫做多元回归,基本公式是Y = b0 + b1X1 + b2X2 + ... + bnXn + ε,每一个系数表示其对应预测变量对因变量的影响。
多元回归使用的函数同样是lm( )函数,对于不同的预测变量,使用➕连接。如果考察某两个变量的交互效应,则使用:连接两个变量。建立null model和拟合回归模型后,使用anova( )分析。
R: The R Project for Statistical Computing
https://www.r-project.org/
RStudio:
https://rstudio.com/
R Project
Linguistics
1
分类预测变量
在之前的回归分析介绍中,我们探讨的预测变量都是连续型变量。比如例子中的WrittenFrequency(书写出现的频率)是一个“连续不断”的变量,它小数点后理论上有无数位。而在我们语