java实现样本方差的计算

转载自:http://my.oschina.net/BreathL/blog/41063

在一些统计或者排序的算法中,常常要用到样本方差这个东西,来判断一组数据的离散程度。

这是样本方差的公式

s^2=\frac{\sum(X_i-\bar X)^2}{N-1}

      然而,在计算机编程中,往往需要计算运行方差(running variance),因为样本的个数总是的在不断变化的,确切将是不断递增;如果每次增加,都要重新计算平均值,再按次公式,计算出方差;虽可以实现,但计算量会随着数据的增长变的太大。

      因此,递推的公式就显得格外重要;通过n-1个样本时的方差值,和新增的样本,就能得到此时这N个样本的方差;这样计算量不会变同时保持在一个很小的值,可大大提高程序的计算效率。递推公式如下:

      Mn = Mn-1+ (xn - Mn-1)/n 

      Sn = Sn-1 + (xn - Mn-1)*(xn - Mn)

      Mn为平均值,初始时: M1 = x1,  S1 = 0 (此等式的推导证明,我后面给出),而样本方差 s =Sn/(n - 1)

      下面是我自己给出的简单实现(若有更好的实现,请不吝赐教)

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
package com.mycode.math;
 
public final class RunningVariance {
     private int count; // 样本的个数
     private double mk; // 平均值
     private double sk; // Sn
     private double runVar; // 样本方差
 
     public RunningVariance() {
         this ( 0 , 0.0 , 0.0 );
     }
 
     public RunningVariance( int count, double mk, double sk) {
         this .count = count;
         this .mk = mk;
         this .sk = sk;
         recomputeRunVar();
     }
 
     public double getMk() {
         return mk;
     }
 
     public double getSk() {
         return sk;
     }
 
     /**
      * 获取运行时样本方差
      *
      * @return
      */
     public synchronized double getRunningVariance() {
         return runVar;
     }
 
     /**
      * 增加样本
      *
      * @param sample
      */
     public synchronized void addSample( double sample) {
         if (++count == 1 ) {
             mk = sample;
             sk = 0.0 ;
         } else {
             double oldmk = mk;
             double diff = sample - oldmk;
             mk += diff / count;
             sk += diff * (sample - mk);
         }
         recomputeRunVar();
     }
 
     /**
      * 移除样本
      *
      * @param sample
      */
     public synchronized void removeSample( double sample) {
         int oldCount = getCount();
         double oldmk = mk;
         if (oldCount == 0 ) {
             throw new IllegalStateException();
         }
         if (--count == 0 ) {
             mk = Double.NaN;
             sk = Double.NaN;
         } else {
             mk = (oldCount * oldmk - sample) / (oldCount - 1 );
             sk -= (sample - mk) * (sample - oldmk);
         }
         recomputeRunVar();
     }
 
     private synchronized void recomputeRunVar() {
         int count = getCount();
         runVar = count > 1 ? sk / (count - 1 ) : Double.NaN;
         // 若需要计算标准差
         // runVar = count > 1 ? Math.sqrt(sk / (count - 1)) : Double.NaN;
     }
 
     public synchronized int getCount() {
         return count;
     }
}

         对于递推公式  Sn = Sn-1 + (xn - Mn-1)*(xn - Mn),我自己做了个简单的推导证明,如下图:

        另:图中所提的 等式1  即是 平均数的递推公式:Mn = Mn-1+ (xn - Mn-1)/n 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值