用python定义计算方差的函数_python-协方差矩阵对角线上的方差的定义

这篇博客探讨了Python中计算方差和协方差的方法,特别是np.var()和np.cov()函数。作者指出,np.cov()计算的方差是样本方差,与np.var()有所不同。文中详细解释了样本均值、样本方差和方差的定义,并提供了相应的Python代码实现。文章还提到了无偏估计的概念,强调了在统计学中这些概念的重要性。
摘要由CSDN通过智能技术生成

在网上查了好久,自己写一个吧。

fc11a3c5f62e3d8352d45637b727444f.png

课本上说协方差阵对角线上是各个变量的方差,然而在numpy中通过np.cov(X)得到的协方差矩阵,其对角线线上的值不是np.var()计算出来的值。根本原因在于,np.cov(X)是在数理统计背景下计算的,得到的方差是样本方差,而不是平常意义下的方差。

嗯,不准确的讲,均值、方差、协方差。在数理统计中,除了均值的计算方式不变之外,其余的两个都是除以

equation?tex=%28n-1%29 ,而不是
equation?tex=n 。这样就可以解释出现上面问题的原因了。

两个随机变量

equation?tex=X_1%2CX_2 ,现在有两个观测数据
equation?tex=%281%2C2%29%2C%283%2C4%29 。每个随机变量可以看作一个特征,因此有
equation?tex=X_1%3D%5B1%2C3%5D%2CX_2%3D%5B2%2C4%5D ,数据矩阵如下

equation?tex=%5Cbegin%7Bbmatrix%7D+1%262%5C%5C3%264+%5Cend%7Bbmatrix%7D%5C%5C

样本均值的定义及python实现

数学定义

equation?tex=%5Cbar%7Bx%7D%3D%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D0%7D%5E%7Bn%7Dx_i ,
equation?tex=x_i%EF%BC%9Ai%3D1%2C2%2C...%2Cn 是随机变量
equation?tex=X
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值