Multi-variable regression analyses
如果现在我需要做一个薄荷糖和肺功能直接关系的研究,你可能会产生以下怀疑
01 很可能你会认为:吸烟者更需要薄荷糖,吸烟者肺功能较弱,这很可能是主因
02 什么说服你这样去想,你会说,如果说不吸烟的薄荷糖使用者的肺功能比不吸烟不吃薄荷糖的人低,同理,吸烟的薄荷糖使用者的肺功能也比吸烟不吃薄荷糖的人低,我会更容易相信你
换句话说,为了证明,我需要提出吸烟状态再去考虑
有时候数据量的规模会导致无法使用简单的线性回归处理,那么,要怎么去对多个回归量进行预测?多个回归量又会导致什么?
01 有些回归量与Y值不相关
02 有些缺省的参数
这时我们就需要应用多变量的回归分析方法,其实就是先把数据进行分类再进行回归模型构建的方法。
练习1:
01 使用杀虫水数据(InsectSprays)数据概况:
> dim(InsectSprays)
[1] 72 2
> head(InsectSprays,15)
count spray
1 10 A
2 7 A
3 20 A
4 14 A
5 14 A
6 12 A
7 10 A
8 23 A
9 17 A
10 20 A
11 14 A
12 13 A
13 11