专栏的前几期文章,临度简单讲解了基础统计的知识,如:
- 两组定量资料的分析思路之t检验
- 多组样本比较之方差分析
- 列联表之卡方检验
之后介绍了logistic回归,如:
- 统计分析之logistic回归
- 单因素logistic回归分析案例
- 多因素logistic回归案例分析
我们知道logistic回归的几个作用:
- 探索危险因素
- 控制协变量,求某种因素对结局的影响
- 统计建模
那我们今天升华一下:
万物皆可盘,数据预未来
模型终有误,或尤建奇功
聊聊这个建模预测的过程
一般常见的统计建模为内部验证和外部验证:内部验证即把一份数据一拆为二,70%用作训练集,30%用作验证集;外部验证即为用已有的数据做模型,用其他的数据来做验证(原理都相似)。
直接上代码:先用SAS随机生成一份数据来演示,样本量1000,因变量y和自变量x1-x4均为二分类(1,0)。