根据样本计算协方差矩阵的过程

最新推荐文章于 2025-03-10 08:44:37 发布

GoodShot

最新推荐文章于 2025-03-10 08:44:37 发布

阅读量5k

点赞数 2

文章标签： python 机器学习人工智能矩阵

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GoodShot/article/details/132536126

版权

假设我们有一个包含3个样本的数据集，每个样本包含3个维度的数据，可以表示为一个3x3的矩阵。我们将使用以下数据集作为示例：

```
数据集 X = [[1, 2, 3],
[4, 5, 6],
[7, 8, 9]]
```

首先，我们需要计算数据集 X 的协方差矩阵。协方差矩阵反映了数据集中各个维度之间的线性相关性。

以下是具体的计算步骤：

1. 计算数据集 X 的均值向量，即每个维度的平均值。在这个例子中，我们可以计算 X 的均值向量为：

```
均值向量 mean_X = [ (1+4+7)/3, (2+5+8)/3, (3+6+9)/3 ] = [4, 5, 6]
```

2. 将数据集 X 的每个样本减去均值向量，得到新的数据集 X_centered。这样做是为了将数据集中心化，消除样本之间的平移影响。计算公式如下：

```
X_centered = X - mean_X
= [[1-4, 2-5, 3-6],
[4-4, 5-5, 6-6],
[7-4, 8-5, 9-6]]
= [[-3, -3, -3],
[0, 0, 0],
[3, 3, 3]]
```

3. 计算数据集 X_cen

最低0.47元/天解锁文章

博客等级

码龄21年

281
原创

960
点赞

3412
收藏

954
粉丝

关注

私信

热门文章

分类专栏

最新评论

4款.Net报表控件优势对比分析
highreport: net报表控件国内最强的应该是HighReport，HighReport是专业的企业级Web报表软件，包括7个核心功能： 1.报表工具(还包括参数面板、图表分析和Web在线报表设计) 2.表单填报(还包括数据回写录入和CRUD功能) 3.流程审批 4.大屏可视化 5.移动App 6.系统管理 7.导出打印
算法中的算子是什么意思,图像处理一样理解
2301_81186103: 函数映射成函数输出不应该是泛函嘛
终于明白协方差的意义了
文笔山郎: 是的，不相关的全称应该是线性不相关。
终于明白协方差的意义了
2301_80401913: 不协方差为0能推出不相关，不能推出独立，对吗？
终于明白协方差的意义了
文笔山郎: 凡是说作者写得好的同志都是没有真正懂的，因为作者的文章中有非常明显的致命错误——协方差为0，变量独立，这个结论是错误的，因为协方差为0，只能说明变量间无线性共变的关系，但是不排除其它关系（比如非线性关系），而独立是指变量之间无任何约束关系，没有任何相互影响，完全是独立取值的。可以说，独立则协方差为0，协方差为0则不能得出独立。因为协方差为0只排除线性关系，而独立则排除一切关系。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。