在网上查了好久,自己写一个吧。
![fc11a3c5f62e3d8352d45637b727444f.png](https://i-blog.csdnimg.cn/blog_migrate/b5f760e043aac1fbc98d96a40393c20c.jpeg)
课本上说协方差阵对角线上是各个变量的方差,然而在numpy中通过np.cov(X)得到的协方差矩阵,其对角线线上的值不是np.var()计算出来的值。根本原因在于,np.cov(X)是在数理统计背景下计算的,得到的方差是样本方差,而不是平常意义下的方差。
嗯,不准确的讲,均值、方差、协方差。在数理统计中,除了均值的计算方式不变之外,其余的两个都是除以
![equation?tex=%28n-1%29](https://i-blog.csdnimg.cn/blog_migrate/73fffe60c99197c28a88375fb94d83be.png)
![equation?tex=n](https://i-blog.csdnimg.cn/blog_migrate/ce59f55893efd960f1dbdfcd5c192a96.png)
两个随机变量
![equation?tex=X_1%2CX_2](https://i-blog.csdnimg.cn/blog_migrate/2f698d04a3dff87986ee476470654ad3.png)
![equation?tex=%281%2C2%29%2C%283%2C4%29](https://i-blog.csdnimg.cn/blog_migrate/2c6fb92a7d4ca109634ca3972f479a75.png)
![equation?tex=X_1%3D%5B1%2C3%5D%2CX_2%3D%5B2%2C4%5D](https://i-blog.csdnimg.cn/blog_migrate/82b4d5f6e43d7551f4d53af6d1279dd0.png)
![equation?tex=%5Cbegin%7Bbmatrix%7D+1%262%5C%5C3%264+%5Cend%7Bbmatrix%7D%5C%5C](https://i-blog.csdnimg.cn/blog_migrate/80c4a8c3cb8b65ba3ea87d38d8092853.png)
样本均值的定义及python实现
数学定义:
![equation?tex=%5Cbar%7Bx%7D%3D%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D0%7D%5E%7Bn%7Dx_i](https://i-blog.csdnimg.cn/blog_migrate/b8fd8f3f624ccbff5efd91b713962a5a.png)
![equation?tex=x_i%EF%BC%9Ai%3D1%2C2%2C...%2Cn](https://i-blog.csdnimg.cn/blog_migrate/bc01ad4b2c52bab3a207d1e9667a5700.png)
![equation?tex=X](https://i-blog.csdnimg.cn/blog_migrate/6ce37be68c2df90fbb8ad8fe13a3f033.png)
在网上查了好久,自己写一个吧。
课本上说协方差阵对角线上是各个变量的方差,然而在numpy中通过np.cov(X)得到的协方差矩阵,其对角线线上的值不是np.var()计算出来的值。根本原因在于,np.cov(X)是在数理统计背景下计算的,得到的方差是样本方差,而不是平常意义下的方差。
嗯,不准确的讲,均值、方差、协方差。在数理统计中,除了均值的计算方式不变之外,其余的两个都是除以
两个随机变量
数学定义: