【吴恩达机器学习】降维

最新推荐文章于 2023-08-30 14:14:18 发布

zxfhahaha

最新推荐文章于 2023-08-30 14:14:18 发布

阅读量961

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zxfhahaha/article/details/89046883

版权

本文详细介绍了主成分分析（PCA）的原理和步骤，包括数据预处理、协方差矩阵计算、特征向量求取等。PCA在数据压缩和可视化方面发挥关键作用，同时探讨了PCA与线性回归的区别，以及PCA在加速学习算法和资源节省方面的应用。此外，文章还指出了一些PCA的常见误用，强调了正则化在防止过拟合中的重要性。

摘要由CSDN通过智能技术生成

降维是无监督学习问题，降维有两个应用：数据压缩和可视化数据

目标一：数据压缩

如果特征高度相关，就要降低维数。本节主要是用了两个例子，二维降到一维、三维降到二维，来告诉我们什么是降维。
二维降到一维就是把二维的点都映射到一条直线，用一个实数z就可以表示，如下图。
在这里插入图片描述
三维降到二维就是把三维的点都映射到一个平面，用两个实数z1和z2就可以表示，如下图。

降维不仅可以减少内存需求，可以使算法运行的更快。

目标2：可视化

当有一个很多维的数据集，我们很难将其可视化。我们可以通过降维把几十维甚至几百维的数据降到2维或3维，这样就可以可视化出来了。

主成分分析问题规划1

降维问题目前最流行的一个算法就是主成分分析（PCA principle components analysis）算法。
PCA会找一个低维平面，然后将数据投影在上面，使样本到这个平面的长度（投影误差）平方最小。

PCA做的是：如果想将数据从二维降到一维，我们要试着找一个向量，假如是向量 $u^{(i)}$ （无论是正的 $u^{(i)}$ 还是负的 $u^{(i)}$ 都没有关系，因为定义的是同一条直线），我们要找一个数据投影后能够最小化投影误差的方向。
如果有N维向量，那就要找k个向量来对数据进行投影
PCA做的是：找到k个向量，然后将数据以最小化平方投影到这k个向量展开的线性子空间上

PCA和线性回归的比较

PCA和线性回归看起来有些相似，下面我们一起来看一下他们之间的区别：

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。