原文链接:
http://tecdat.cn/?p=18169tecdat.cn比如说分类变量为是否幸存、是因变量,连续变量为年龄、是自变量,这两者可以做相关分析吗?两者又是否可以做回归分析?
我们考虑泰坦尼克号数据集,
titanic = titanic[!is.na(titanic$Age),]
attach(titanic)
考虑两个变量,年龄x(连续变量)和幸存者指标y(分类变量)
X = Age
Y = Survived
年龄可能是逻辑回归中的有效解释变量,
summary(glm(Survived~Age,data=titanic,family=binomial))
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.05672 0.17358 -0.327 0.7438
Age -0.01096 0.00533 -2.057 0.0397 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Nu