考试结束了,仙友们估计都精疲力竭了,开启了短暂的休息时间。回忆备考时各路修仙大队、小分队长期不懈的并肩作战、互相督促、学习和努力,那种感觉真是美好,前进的路上,你不是在孤军奋战。
本来想着考完试后,临幸下四公主狂打一个月游戏,彻底舒缓一下那持续8个月压在心口上的那口气,后来发现硬核游戏好难打,被BOSS疯狂教做人后气不打一处来,还是乖乖看书吧,把今年学习的内容趁热打铁总结完成,给2020年画下一个句号。
之前由于备考,心理统计学的重点章节的总结没有全部完成,接下来还需要总结卡方检验、非参数检验、线性回归三大章节,今天我们先来看卡方检验。
本文篇幅较长、内容较多,总结的顺序为:
卡方检验别名、卡方检验原理、实际次数、理论次数
卡方检验的假设、卡方检验的类别、卡方检验的基本公式、期望次数计算、连续性校正
配合度检验:检验无差假说、检验假设分布的概率、分布拟合检验(吻合性检验)、比率或百分比配合度检验
独立性检验:独立样本四格表独立性检验、相关样本四格表独立性检验、RXC表独立性检验
同质性检验:单因素分类数据同质性检验、列联表形式同质性检验
第一节:卡方检验原理
一、基本概念
1. 卡方检验的别名:
卡方检验:由于是对计数数据统计分析的根据是卡方分布,所以称这类统计方法为卡方检验。
列联表分析或交叉表分析:在初步整理技术数据时,除了用次数分布表呈现数据之外,大都用列联表(contingency table)或交叉表(cross tabulation)的单元格形式,也称为列联表分析或交叉表分析。
百分比检验:因卡方检验使用的列联表的单元格里的值是次数或百分比,所以也称为百分比检验。
非参数检验:因为对计数数据总体的分布形态不做任何假设,卡方检验被视为非参数检验方法的一种。
2. 卡方检验能处理一个因素两项或多项分类的实际观察频数与理论频数分布是否一致的问题,或者说有无显著性差异问题。
3. 实际频数(actual frequencies):简称实计数或实际数,指在实验或调查中得到的计数资料,也称为观察频数(observed frequencies)。
4. 理论频数(theoretical frequencies):是根据概率原理、某种理论、某种理论次数分布或经验分布计算出的次数,也称为期望频数(expect frequencies)。
二、卡方检验的假设
1. 分类相互排斥、互不相容:每一个观测值只能被划分到一个类别或另一个类别之中,不能出现某一观测值同时划分到多个类别当中的情况。
2. 独立性假设:即观测值相互独立。各个被试的观测值之间彼此独立,是最基本的一个假设。在实际研究中,让观测值的总数等于实验中不同被试的总数,要求每个被试只有一个观测值,这是确保观测值相互独立最安全的做法。
3. 期望次数的大小
为使卡方分布称为卡方值合理准确的近似估计,每一个单元格中的期望次数应该至少在5个以上。
更严谨的统计学家提出更严格的标准:当自由度为1时,每一个单元格的期望次数至少不应低于10才能保证检验的准确性。
在许多分类研究中,若自由度很大,有几个类别的理论次数虽然很小,但在可接受的标准范围内,只有一个类别的理论次数低于1,此时,简单的处理原则是设法使每一个类别的理论次数都不要低于1,分类中不超过20%的类别的理论次数可以小于5。
三、卡方检验的类别
1. 配合度检验: