大白话讲解卡方鉴定【案例】播放的背景音乐对于卖酒有什么样的销售影响?

【大白话】卡方鉴定

前言:卡方鉴定是用于类别性与类别性的相关性鉴定,相关性越高则说明该字段对目标字段的影响相关度越高。(如果目标是类别,输入是数值则用T鉴定和方差鉴定。)

学习背景:独立事件概率概念

正文:

【案例】播放的背景音乐对于卖酒有什么样的销售影响?

三种背景音乐:1)French音乐2)Italian音乐3)无音乐

三种酒类:1)French酒2)Italian酒3)其他酒

现在有以下的真实数据,判断音乐对酒是否有影响?

音乐

列总数

French

Italian

French

30

39

30

99

Italian

11

1

19

31

其他

43

35

35

113

行总数

84

75

84

243

(真实销售数据)

第一步:假设两个字段不相关时(独立时),计算销售量的期望值

没有音乐的状况下会卖出酒的概率是=84/243;卖出法国酒的概率=99/243

假设音乐与卖酒出去的瓶数是相互独立(不相关的)

那么在没有音乐的状况且卖出法国酒的数量=84/243*99/243*243=34.222

所有数值以此类推计算出独立事件的期望值,如下:

酒(瓶)

音乐

列总数

French

Italian

French

34.222

30.556

34.222

99.000

Italian

10.716

9.568

10.716

31.000

其他

39.062

34.877

39.062

113.001

行总数

84.000

75.001

84.000

243.001

(独立事件的期望数据)

第二步:看看实际销量与预测销量的差异性(差异大则说明独立假设不成立,2个字段相关。)

差异性表达方程式即为卡方鉴定:


最终18.28即为卡方鉴定的值。

第三步:查看卡方鉴定表比较是否超过标准值(超过则表明音乐对酒销量是有效的)

说明:F为对应自由度。自由度=(行字段数-1)*(列字段数-1)=4

通常置信度取95%在表格中对应为0.05那一列。所以对应的临界值=9.49<18.28

说明音乐对销售酒有较高影响

【拓展】我们在选取字段时可以用卡方检验来帮助判断类别性变量与类别性目标变量的相关性,相关性低可选择尝试放弃该字段。比如在信用风险评估时,我们判断好客户与是否有工作是否有关系就可以用该判定方法。

SAS 软件实现方法:(来源百度知道)

利用统计学软件分析结果如下:

data kafang;

input row column number @@;

cards;

1 1 52

1 2 19

2 1 39

2 2 3

;

run;

proc freq;

tables row*column/chisq;

weight number;

run;

统计量

自由度

概率

卡方

1

6.4777

0.0109(显著)

似然比卡方

1

7.3101

0.0069

连续校正卡方

1

5.2868

0.0215

Mantel-Haenszel 卡方

1

6.4203

0.0113

Phi 系数

 

-0.2394

 

列联系数

 

0.2328

 

Cramer V

 

-0.2394

 

 


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值