Chapter 7 Goodness of Fit
本篇是第七章,内容是拟合优度检验。
[TOC]
1.多项分布
拟合优度检验的第一个应用是关于多项总体。那么多项总体(或者多项分布)是什么呢?
多项分布是二项分布的推广。
总体被分为几个互不相交的类别。
多项分布假设:每次试验有且仅有一个结果发生;每次试验独立;每次试验概率不变。
拟合优度检验-多项总体步骤
将所观测到的数据与理论上的期望值进行比较。
步骤:
拟合优度检验用于多项总体检验没有直接的函数,这里用R语言的自编函数实现,体会下具体的算法(当然感觉自己写的略复杂)。代码依旧是后面放出,函数具体使用说明也会附上。
2.独立性
依旧是从问题出发——性别与购物频率是否有关系
独立性检验——该统计方法常用于检验两个分类变量是否有关系。那么首先要提到两个概念——独立事件和非独立事件(independent and dependent events)。
独立事件——一个事物发生不会对其他事物发生概率造成影响。
非独立事件——一个事物发生会影响其他事物发生概率。
接着统计学构建出了一个表来进行独立性检验。这就是联立表(Contingency Tables)。
解决多总体比例问题。
之前通常用两个或两个以上特征来对样本观测值分类。
也被称为交叉表。
一般在R中,使用Table函数即可生成两个特征(分类变量)的联立表,xtabs则是根据公式创立联立表&#x