文章目录
1.0 方差分析
1.1方差分析概念
通过对数据误差来源分析 检验 各总体的均值是否相等,来判断分类型自变量 对 数值型因变量是否显著影响。
1.2 单因素方差分析
只有一个因素的方差分析,涉及分类型自变量和数值型自变量两个变量。
1.2.1 单因素方差分析
在单因素的方差分析中我们涉及两个变量:
一个是分类变量(行业),
一个是数值型变量(被投诉次数)。
方差分析要研究的就是行业对被投诉次数是否有显著影响。
1.2.2 方差分析基本数语
- 因素:既因子,所要检验的对象。例题里就是行业
- 水平:又称处理,既因素的不同表现。就是行业里的零售、旅游业。。等等
- 观测值:每个因子水平下得到的样本数据。比如零售业的被投诉次数。
1.2.3 造成误差的原因
-
组内误差
- 由于抽样的随机性所造成的误差,既来自水平内部的数据误差,反映一个样本内部数的离散程度。
-
组间误差
- 来自不同水平之间的数据误差,这种误差可能是由抽样本身形成的误差,也可能是由行业本身的系统性因素造成的系统误差。就是不同行业之间它本身是有区别的。
-
随机误差
- 因素同一水平(行业)下,样本各观察值之间的差异,有样本随机性形成(感觉可忽略)
通过样本的增大,可无限减少该随机误差
- 因素同一水平(行业)下,样本各观察值之间的差异,有样本随机性形成(感觉可忽略)
-
系统误差
- 因素的不同水平下(不同总体)之间观察值的差异,由于行业本身的系统性因素所造成的。
1.3 方差分析的3个假定
1、假定每个总体都应该服从正态分布:各行业的被投诉次数是服从正态分布的
2、假定各个总体的方差是相同的
3、假定各观察值是独立的:比如零售业的被投诉次数与其他行业的被投诉次数是独立的
1.4 方差分析的步骤
1 提出假设
2 构造检验的统计量
3 统计决策