卡方检验

目录

概念

例子

卡方检验计算

由卡方到 p 值

卡方值表


概念


卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度。

实际观测值与理论推断值之间的偏离程度就决定卡方值的大小:

  • 如果卡方值越大,二者偏差程度越大

  • 如果卡方值越小,二者偏差越小

  • 如果两个值完全相等时,卡方值就为0,表明理论值完全符合

注意:卡方检验针对分类变量。

例子


卡方检验  可以用指定的一个“p”值去判定,“p”是变量独立的概率。

例子-1:性别对度假方式的偏爱有影响吗?

 

沙滩

邮轮

209

280

225

248

如果性别(男或女)真的对度假方式的偏爱有影响,它们便是相依的。

可以用一个特别的算法算出一个 “p” 值:

p 值是 0.132

通常 p < 0.05 代表变量是相依的。在这例子里,p > 0.05,所以变量是独立(没关联)的。

就是说,男人和女人对沙滩度假和邮轮度假的偏爱可能是没有分别的。

例子-2:性别对宠物的偏爱有影响吗?

 

207

282

231

242

算出 “p” 值:

p 值是 0.043

在这例子里,p < 0.05,所以这个调查结果是 "显著" 的,意思是变量不是独立的。

换句话说,因为 0.043 < 0.05,可以推测性别与宠物偏爱是有关联的(男人和女人对猫和狗的偏爱是不同的)。

注意:

  • 以上两个例子的数据是相似的,但 p 值相差很大(0.132 和 0.043),所以卡方检验是一个敏感的测试

  • 用 p < 0.05 是个惯例,也可以用 p < 0.01 来更加确定每组的调查结果是不同的,也可以选其它觉得合适的值

卡方检验计算


卡方检验只适用于分类数据(分成不同类别的数据),像性别 {Men, Women} 或颜色 {Red, Yellow, Green, Blue} 等等,而不适用于数值数据,例如身高、体重等等。

数据的值需要是相当大的,每个数值需要是 5 或更大。在以上的例子里,数值是 209、282 等,所以是合适的。

计算卡方值:

1)把行和列分别加起来:

 

 

207

282

489

231

242

473

 

438

524

962

2)求每项的“期望值”(X * P(X)):

 

 

489 × 438 / 962 = 222.64

489 × 524 / 962 = 266.36

489

473 × 438 / 962 = 215.36

473 × 524 / 962 = 257.64

473

 

438

524

962

3)求每项的卡方:

计算公式:

其中,O = 观察(实际)值,E = 期望值

 

 

(207 - 222.64)^2 / 222.64 = 1.099

(282 - 266.36)^2 / 266.36 = 0.918

489

(231 - 215.36)^2 / 215.36 = 1.136

(242 - 257.64)^2 / 257.64 = 0.949

473

 

438

524

962

现在把这些值相加:

1.099 + 0.918 + 1.136 + 0.949 = 4.102

卡方是 4.102

由卡方到 p 值


用卡方的值来求 p 值是个复杂的算法,可以去查表或使用卡方计算器。

先求 "自由度" (DF),自由度计算公式:(行数 − 1) * (列数 − 1)

上面例子: DF = (2 − 1)(2 − 1) = 1×1 = 1

结果是:p = 0.04283

卡方值表


DF

P

0.995

0.99

0.975

0.95

0.9

0.75

0.5

0.25

0.1

0.05

0.025

0.01

0.005

1

0.02

0.1

0.45

1.32

2.71

3.84

5.02

6.63

7.88

2

0.01

0.02

0.02

0.1

0.21

0.58

1.39

2.77

4.61

5.99

7.38

9.21

10.6

3

0.07

0.11

0.22

0.35

0.58

1.21

2.37

4.11

6.25

7.81

9.35

11.34

12.84

4

0.21

0.3

0.48

0.71

1.06

1.92

3.36

5.39

7.78

9.49

11.14

13.28

14.86

5

0.41

0.55

0.83

1.15

1.61

2.67

4.35

6.63

9.24

11.07

12.83

15.09

16.75

6

0.68

0.87

1.24

1.64

2.2

3.45

5.35

7.84

10.64

12.59

14.45

16.81

18.55

7

0.99

1.24

1.69

2.17

2.83

4.25

6.35

9.04

12.02

14.07

16.01

18.48

20.28

8

1.34

1.65

2.18

2.73

3.4

5.07

7.34

10.22

13.36

15.51

17.53

20.09

21.96

9

1.73

2.09

2.7

3.33

4.17

5.9

8.34

11.39

14.68

16.92

19.02

21.67

23.59

10

2.16

2.56

3.25

3.94

4.87

6.74

9.34

12.55

15.99

18.31

20.48

23.21

25.19

11

2.6

3.05

3.82

4.57

5.58

7.58

10.34

13.7

17.28

19.68

21.92

24.72

26.76

12

3.07

3.57

4.4

5.23

6.3

8.44

11.34

14.85

18.55

21.03

23.34

26.22

28.3

13

3.57

4.11

5.01

5.89

7.04

9.3

12.34

15.98

19.81

22.36

24.74

27.69

29.82

14

4.07

4.66

5.63

6.57

7.79

10.17

13.34

17.12

21.06

23.68

26.12

29.14

31.32

15

4.6

5.23

6.27

7.26

8.55

11.04

14.34

18.25

22.31

25

27.49

30.58

32.8

16

5.14

5.81

6.91

7.96

9.31

11.91

15.34

19.37

23.54

26.3

28.85

32

34.27

17

5.7

6.41

7.56

8.67

10.09

12.79

16.34

20.49

24.77

27.59

30.19

33.41

35.72

18

6.26

7.01

8.23

9.39

10.86

13.68

17.34

21.6

25.99

28.87

31.53

34.81

37.16

19

6.84

7.63

8.91

10.12

11.65

14.56

18.34

22.72

27.2

30.14

32.85

36.19

38.58

20

7.43

8.26

9.59

10.85

12.44

15.45

19.34

23.83

28.41

31.41

34.17

37.57

40

21

8.03

8.9

10.28

11.59

13.24

16.34

20.34

24.93

29.62

32.67

35.48

38.93

41.4

22

8.64

9.54

10.98

12.34

14.04

17.24

21.34

26.04

30.81

33.92

36.78

40.29

42.8

23

9.26

10.2

11.69

13.09

14.85

18.14

22.34

27.14

32.01

35.17

38.08

41.64

44.18

24

9.89

10.86

12.4

13.85

15.66

19.04

23.34

28.24

33.2

36.42

39.36

42.98

45.56

25

10.52

11.52

13.12

14.61

16.47

19.94

24.34

29.34

34.38

37.65

40.65

44.31

46.93

26

11.16

12.2

13.84

15.38

17.29

20.84

25.34

30.43

35.56

38.89

41.92

45.64

48.29

27

11.81

12.88

14.57

16.15

18.11

21.75

26.34

31.53

36.74

40.11

43.19

46.96

49.64

28

12.46

13.56

15.31

16.93

18.94

22.66

27.34

32.62

37.92

41.34

44.46

48.28

50.99

29

13.12

14.26

16.05

17.71

19.77

23.57

28.34

33.71

39.09

42.56

45.72

49.59

52.34

30

13.79

14.95

16.79

18.49

20.6

24.48

29.34

34.8

40.26

43.77

46.98

50.89

53.67

40

20.71

22.16

24.43

26.51

29.05

33.66

39.34

45.62

51.8

55.76

59.34

63.69

66.77

50

27.99

29.71

32.36

34.76

37.69

42.94

49.33

56.33

63.17

67.5

71.42

76.15

79.49

60

35.53

37.48

40.48

43.19

46.46

52.29

59.33

66.98

74.4

79.08

83.3

88.38

91.95

70

43.28

45.44

48.76

51.74

55.33

61.7

69.33

77.58

85.53

90.53

95.02

100.42

104.22

80

51.17

53.54

57.15

60.39

64.28

71.14

79.33

88.13

96.58

101.88

106.63

112.33

116.32

90

59.2

61.75

65.65

69.13

73.29

80.62

89.33

98.64

107.56

113.14

118.14

124.12

128.3

100

67.33

70.06

74.22

77.93

82.36

90.13

99.33

109.14

118.5

124.34

129.56

135.81

140.17

 

 

  • 5
    点赞
  • 41
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
卡方检验是一种用于检验观测频数与期望频数之间差异的统计方法。在Python中,可以使用scipy.stats模块中的chisquare函数进行卡方检验卡方检验可以分为独立性卡方检验和一致性卡方检验独立性卡方检验用于判断两个变量之间是否存在独立关系,而一致性卡方检验用于判断一个变量在不同条件下的分布是否一致。 对于独立性卡方检验,可以使用Python的chisquare函数进行计算。例如,给定观测频数列表list_observe和期望频数列表list_expect,可以通过调用chisquare函数来进行独立性卡方检验。 对于一致性卡方检验,也可以使用相同的chisquare函数进行计算。只需将观测频数列表和期望频数列表作为参数传递给函数即可。 在计算卡方检验时,需要注意观测频数和期望频数不能低于5,否则结果可能不可靠。通过计算卡方和对应的p-value,可以判断是否存在显著差异。如果p-value大于0.05或者为"nan",则可以认为没有差异;反之,如果p-value小于等于0.05,则可以认为存在差异。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [卡方检验 python](https://blog.csdn.net/sinat_23971513/article/details/111192975)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [python数据分析 - 卡方检验](https://blog.csdn.net/weixin_42010722/article/details/124296654)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值