前一篇说了卡方分布的定义和来由,以及卡方统计量,这次介绍下如何像卡尔·皮尔逊(Karl·Pearson)一样通过卡方统计量来做分布拟合优度检验Goodness-of-fit Test for Distribution。
- 卡方检验:
先来回顾一下卡尔·皮尔逊(Karl·Pearson)所提出的卡方统计量:数据的分布与理想分布之间的差异的度量,
其中:
- fo为实际观测的频度Observed Frequency
- fe为期望的事件频度Expected Frequency
从卡方统计量的公式可以得出,如果观测的结果与期望的完全一致则χ2 = 0,说明拟合度处于完美情况;当χ2大到一定程度时,也就是累计卡方贡献度超出设定的置信度范围(通常默认为α = 0.05,置信度