1. 卡方检验
卡方检验是一种非参数检验,是一种根据样本数据推断总体数据与期望分布或者某种理论分布是否一致的方法,是一种吻合性检验,原假设是:样本来自的总体,其分布与某一理论分布无显著差异。
比如,在研究某软件的上线人数时,发现一周之中,周一最多,其他时间相当,大概比例是3:1:1:1:1:1:1,现在收集到了一段时间的上线人数比例,要确定到底符不符合上述分布。
思路:
如果从一个随机变量X中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观察频数符合一个多项分布,当k趋于无穷时,这个分布近似服从卡方分布。
典型的Pearson卡方统计量,其数学定义为:
K为子集个数,fi0为期望频数,fie为观察频数,卡方的自由度为k-1ÿ