another blog fffffff

原创 2015年07月10日 16:25:43

目前Spark中只提供了皮尔森chi平方距离检测法(Pearson’s chi-squared ( χ2) ),也称卡方检验,它由统计学家皮尔逊推导。理论证明,实际观察次数(fo)与理论次数(fe)之差的平方再除以理论次数所得的统计量,近似服从卡方分布。卡方检验的两个主要应用:拟合性检验和独立性检验,拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题(参见http://en.wikipedia.org/wiki/Chi-squared_test)。在Spark中,拟合度检验要求输入为Vector, 独立性检验要求输入是Matrix,另外还支持RDD[LabeledPoint]的独立性检验。



相关文章推荐

Move another blog here

Thursday, August 12, 2010Case study: crash in unloaded module  Some time ago we got a problem that o...

为啥_wtol("4294967295")的结果不是0xffffffff而是0x7fffffff

今天看一个软件的更新时 取的http头信息中的Content-length+1 作为内存分配,晚上测试了下 发现可以单独的更改http 头中的Content-length长度信息为0xffffffff...

为什么很多人喜欢把INF的初值赋成0x3f3f3f3f而不是0x7fffffff?

在算法竞赛中,我们常常需要用到一个“无穷大”的值,对于我来说,大多数时间我会根据具体问题取一个99999999之类的数(显得很不专业啊!)在网上看别人代码的时候,经常会看到他们把INF设为0x7fff...
  • Hawo11
  • Hawo11
  • 2017年10月18日 17:04
  • 67

Yet Another Shell

  • 2016年10月05日 19:37
  • 2KB
  • 下载

hdu 2955 Robberies + LightOJ 1079 Just another Robbery (01背包 概率)

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2955 题意:有一个小偷要偷银行的钱,可是他偷没家银行总是有一定的概率被抓,现在给了你一个概率P,只要他...

Another Attack on A5

  • 2012年04月12日 15:46
  • 385KB
  • 下载

another test

目录: 1.一些被认作函数的宏 2.关于printf的一个测试 3.%c与%1s的测试 4.FILE的定义 5.标准输入输出 6.ferror 7.ferror的孪生兄弟feof...
  • Staibin
  • Staibin
  • 2014年01月21日 14:23
  • 414
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:another blog fffffff
举报原因:
原因补充:

(最多只允许输入30个字)