平均值和方差的递推公式以及python实现

有时候在处理流式数据的时候,需要实时更新数据的统计值,如平均值和方差,如果通过传统求解方差或者平均值时,每到达一个新的数据就需要遍历来求解。在数据量比较少的时候,通过遍历和递推求解的时间消耗和空间消耗并不是很明显,但是在大数据或者流式数据的应用场景下, O ( n ) O(n) O(n) O ( 1 ) O(1) O(1)的时间复杂度以及空间复杂度的区别还是很明显的。

均值公式: A n = 1 n ∑ i = 1 n X i A_{n} = \frac{1}{n}\sum^{n}_{i=1}X_{i} An=n1i=1nXi
均值递推公式: A n = A n − 1 + ( X n − A n − 1 ) n A_{n} = A_{n-1} + \frac{(X_{n} - A_{n-1})}{n} An=An1+n(XnAn1)
方差公式: V n = 1 n ∑ i = 1 n ( X i − A n ) V_{n} = \frac{1}{n}\sum_{i=1}^{n}(X_{i} - A_{n}) Vn=n1i=1n(XiAn)
方差递推公式: V n = n − 1 n 2 ( X n − A n − 1 ) 2 + n − 1 n V n − 1 V_{n} = \frac{n-1}{n^{2}}(X_{n} - A_{n-1})^{2} + \frac{n-1}{n}V_{n-1} Vn=n2n1(XnAn1)2+nn1Vn1

均值递推公式可以参考:https://blog.csdn.net/u014485485/article/details/77679669
方差递推公式可以参考:https://blog.csdn.net/wuqinlong/article/details/78432574

python代码:

import numpy as np

class CalMeanVar():
    def __init__(self):
        self.count = 0
        self.A = 0
        self.A_ = 0
        self.V = 0

    def cal(self, data):
        self.count += 1
        if self.count == 1:
            self.A_ = data
            self.A = data
            return
        self.A_ = self.A
        self.A = self.A + (data - self.A) / self.count
        self.V = (self.count - 1) / self.count ** 2 * (data - self.A_)**2 + (self.count - 1)/self.count * self.V

if __name__ == '__main__':
    data = np.linspace(1,5, 5)
    print(data)
    print(data.mean())
    print(data.var())

    cmv = CalMeanVar()
    for i in range(len(data)):
        cmv.cal(data[i])
    print(cmv.A)
    print(cmv.V)
  • 4
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 假设有一组数据 $x_1, x_2, ..., x_n$,其均值方差分别为 $\mu_n$ 和 $\sigma^2_n$,现在要求加入一个新数据 $x_{n+1}$,则可以使用以下递推公式计算新的均值方差: $$\mu_{n+1}=\frac{n\mu_n+x_{n+1}}{n+1}$$ $$\sigma^2_{n+1}=\frac{n\sigma^2_n+(x_{n+1}-\mu_n)(x_{n+1}-\mu_{n+1})}{n+1}$$ 其中,$\mu_{n+1}$ 表示加入新数据后的均值,$\sigma^2_{n+1}$ 表示加入新数据后的方差,$n$ 为已有数据的数量。 ### 回答2: MATLAB可以通过递推公式计算均值方差。具体实现如下: 1. 均值递推公式: 要计算一组数据的均值,可以使用以下递推公式: μ_n = μ_{n-1} + (x_n - μ_{n-1}) / n 其中,μ_n表示前n个数据的均值,x_n表示第n个数据,n表示数据的总个数。初始时,μ_0为0。通过不断更新μ_n的值,最终得到整组数据的均值。 2. 方差递推公式: 要计算一组数据的方差,可以使用以下递推公式: σ^2_n = ((n-1) * σ^2_{n-1} + (x_n - μ_{n-1})^2) / n 其中,σ^2_n表示前n个数据的方差,x_n表示第n个数据,μ_{n-1}表示前n-1个数据的均值,σ^2_{n-1}表示前n-1个数据的方差,n表示数据的总个数。初始时,σ^2_0为0。通过不断更新σ^2_n的值,最终得到整组数据的方差。 在MATLAB中,可以使用循环结构来依次读入数据并更新均值方差的值。首先设置初始的均值方差为0,然后根据上述递推公式,在每次循环中更新均值方差的值。最后计算得到整组数据的均值方差。这样就实现均值方差递推公式的计算。 以上是MATLAB实现均值方差递推公式的方法,通过这种方式可以方便地计算一组数据的均值方差。 ### 回答3: MATLAB可以通过使用递推公式来计算均值(Mean)和方差(Variance),以下是两个基本的递推公式实现方法。 首先,计算均值递推公式如下: 1. 声明一个变量sum来保存所有数据点的累加和,并初始化为0。 2. 声明一个变量count来保存已处理的数据点数目,并初始化为0。 3. 使用循环结构遍历所有数据点,将数据点的值加到sum中,并将count加1。 4. 最终,均值的计算公式为mean = sum / count。 下面是用MATLAB代码实现的例子: sum = 0; % 初始化累加和为0 count = 0; % 初始化数据点数目为0 for i = 1:length(data) sum = sum + data(i); % 将数据点的值加到累加和中 count = count + 1; % 增加数据点数目 end mean = sum / count; % 计算均值 接下来,计算方差递推公式如下: 1. 声明一个变量sum_sq来保存所有数据点的平方和,并初始化为0。 2. 使用循环结构遍历所有数据点,将数据点的平方加到sum_sq中。 3. 最终,方差的计算公式为variance = (sum_sq - sum^2 / count) / (count - 1)。 下面是用MATLAB代码实现的例子: sum_sq = 0; % 初始化平方和为0 for i = 1:length(data) sum_sq = sum_sq + data(i)^2; % 将数据点的平方加到平方和中 end variance = (sum_sq - sum^2 / count) / (count - 1); % 计算方差 通过这些递推公式,MATLAB可以很方便地计算均值方差。在计算过程中,需要使用循环结构来遍历所有数据点,并逐步更新累加和和平方和。最终,根据公式计算出均值方差的数值。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值