关闭

R语言实施皮尔森卡方检验

标签: r语言卡方检验
849人阅读 评论(0) 收藏 举报
分类:

说明

检查两个数据集中的类别分量是否不同,在统计中会碰到离散型数据与计数数据,比如性别分男、女,某个问题的态度分为赞成、反对,成绩可分优良差,能力可分高中低。对这类数据的统计处理的假设检验一般用计数数据的统计方法进行非参数检验。
卡方检验主要用于两个方面,一是对总体分布进行拟合性检验,检验观查次数是否与某种理论次数相一致。
二是独立性检验,用于检验两组或者多组资料相互关联还是彼此独立。

操作示例(独立性检验)

#mtcars$am有0,1两个因素表示行,mtcars$gear 有3,4,5三个因素表示列
library(stats)
data("mtcars)
ftable = table(mtcars$am,mtcars$gear)
ftable = table(mtcars$am,mtcars$gear)
ftable = table(mtcars$am,mtcars$gear)
> ftable

     3  4  5
  0 15  4  0
  1  0  8  5
#绘制列联表的马赛克图
mosaicplot(ftable,main ="number of forward gears within automatic and manual cars",color = TRUE )

手动档与自动档汽车前轮驱动齿轮的马赛克图

对列联表执行卡方检验,以检测自动档与手动档汽车前驱的齿轮数目是否相同:

chisq.test(ftable)

    Pearson's Chi-squared test

data:  ftable
X-squared = 20.945, df = 2, p-value = 2.831e-05

Warning message:
In chisq.test(ftable) : Chi-squared近似算法有可能不准

总结

卡方检验用于发现两个类别变量之间是否存在某种关联,最适用于数组中非成组信息的检验。使用条件:1.数据都为类别数据2.变量包括两个或者两个以上独立数据组。
H0:变量A与变量B相互独立(gear数目相同)
H1:变量A与变量B相互不独(gear数目不相同)
由图知:自动档的gear要小于手动档的gear.p-value<0.05,拒绝H0,接收H1.
样例输出了一个警告信息,此次卡方检验的结果可能不正确,这是因为列联表的个数小于5。

0
0
查看评论
发表评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场

卡方检验的原理作用以及Python、R语言的实现方式

卡方检验(chi-square test) 或称X^2检验,主要作用是判定实际统计数据是否符合期望值,之后便可以演变出各种用法,例如:特征选择,变量各类的出现概率,变量是否相互有关联等。 主要公式: 右侧的X^2代表卡方值,卡方值=[(观测值O-期望值E)/期望值E]所有的组别的累加。 ...
  • jerry81333
  • jerry81333
  • 2016-10-07 08:40
  • 8307

统计学三大相关系数之皮尔森(pearson)相关系数

最早接触pearson相关系数时,是和同学一起搞数学建模,当时也是需要一种方法评价两组数据之间的相关性,于是找到了皮尔森(pearson)相关系数和斯皮尔曼(spearman)相关系数。其实,还有一种相关系数肯德尔(kendall)相关系数。三大相关系数中,spearman和kendall属于等级相...
  • AlexMerer
  • AlexMerer
  • 2017-07-10 08:58
  • 1740

卡方检验的原理作用以及Python、R语言的实现方式

卡方检验(chi-square test) 或称X^2检验,主要作用是判定实际统计数据是否符合期望值,之后便可以演变出各种用法,例如:特征选择,变量各类的出现概率,变量是否相互有关联等。 主要公式: 右侧的X^2代表卡方值,卡方值=[(观测值O-期望值E)/期望值E]所有的组别的累加。 ...
  • jerry81333
  • jerry81333
  • 2016-10-07 08:40
  • 8307

卡方检验及R语言实现

卡方检验及R语言实现
  • lijinxiu123
  • lijinxiu123
  • 2017-03-27 17:48
  • 7207

线性相关系数、卡方检验、互信息

线性相关系数、卡方检验、互信息线性相关系数卡方检验互信息 线性相关系数 卡方检验 互信息 总结相信大家在数据挖掘的很多地方大家都看到这三个概念,比如说线性拟合的时候,看线性相关系数来评估拟合程度;在特征工程中,这三个都是filter类方法之一(过滤型)。那今天给大家总结下这三个概念,个人才疏学浅,有...
  • gdanskamir
  • gdanskamir
  • 2017-02-07 17:39
  • 1396

卡方独立性检验chisq.test()

先引用一段R IN ACTION 的话:R提供了多种检验类别型变量独立性的方法。本节中描述的三种检验分别为卡方独立性检验、Fisher精确检验和Cochran-Mantel–Haenszel检验。 你可以使用chisq.test()函数对二维表的行变量和列变量进行卡方独立性检验。示例参见代码清单7-...
  • ForRubyDownLoad
  • ForRubyDownLoad
  • 2016-03-01 23:29
  • 3393

总结卡方检验(Chi-square test)和费舍尔精确检验(Fisher exact test)的区别

之前我一直都没有弄清楚卡方检验和Fisher exact test的区别。今天花时间专门整理、学习一下。 卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数...
  • u011955252
  • u011955252
  • 2016-02-20 13:30
  • 9656

皮尔森相似度计算举例(R语言)

整理了一下最近对协同过滤推荐算法中的皮尔森相似度计算,顺带学习了下R语言的简单使用,也复习了概率统计知识。一、概率论和统计学概念复习1)期望值(Expected Value)因为这里每个数都是等概率的,所以就当做是数组或向量中所有元素的平均数吧。可以使用R语言中函数mean()。2)方差(Varia...
  • dc_726
  • dc_726
  • 2014-10-12 14:52
  • 16624

R语言之假设检验篇

假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是由本质差别所造成的一种统计推断方法。 其基本思想是小概率反证法思想。 小概述思想是指小概率事件(P 反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能...
  • lilanfeng1991
  • lilanfeng1991
  • 2014-01-25 21:15
  • 3987

卡方检验x2检验(chi-square test)

x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。     一、四格表资料的x2检验     例20.7某医院分...
  • resourse_sharing
  • resourse_sharing
  • 2016-07-07 16:31
  • 4488
    个人资料
    • 访问:81913次
    • 积分:1725
    • 等级:
    • 排名:千里之外
    • 原创:92篇
    • 转载:0篇
    • 译文:0篇
    • 评论:4条
    文章分类
    最新评论