![ccfc6de191d4af7e247135c3fee5f0aa.png](https://img-blog.csdnimg.cn/img_convert/ccfc6de191d4af7e247135c3fee5f0aa.png)
作者:Peter
红色石头的个人网站:
红色石头的个人博客-机器学习、深度学习之路www.redstonewill.com![f4ed3cbb6c73a1b019001c4107a49f91.png](https://img-blog.csdnimg.cn/img_convert/f4ed3cbb6c73a1b019001c4107a49f91.png)
系列文章:
吴恩达《Machine Learning》精炼笔记 1:监督学习与非监督学习
吴恩达《Machine Learning》精炼笔记 2:梯度下降与正规方程
吴恩达《Machine Learning》精炼笔记 3:回归问题和正则化
吴恩达《Machine Learning》精炼笔记 4:神经网络基础
吴恩达《Machine Learning》精炼笔记 5:神经网络
吴恩达《Machine Learning》精炼笔记 6:关于机器学习的建议
吴恩达《Machine Learning》精炼笔记 7:支持向量机 SVM
吴恩达《Machine Learning》精炼笔记 8:聚类 KMeans 及其 Python实现
在本文中主要介绍的是数据降维相关的内容,重点讲解了PCA算法
- 为什么要实施降维
- 数据压缩
- 数据可视化
- PCA算法
- PCA和线性回归算法的区别
- PCA算法特点
- Python实现PCA
- sklearn中实现PCA
为何降维
在现实高维数据情况下,会有数据样本稀疏、距离计算困难等问题,被称为维数灾难。
解决的方法就是降维,也称之为“维数约简”,即通过某种数据方法将原始高维属性空间转成一个低维“子空间”。在这个子空间中,样本密度大大提高,将高维空间中的一个低维“嵌入”。
![0f061a2031d3c596568b6a410186f508.png](https://img-blog.csdnimg.cn/img_convert/0f061a2031d3c596568b6a410186f508.png)
降维Dimensionality Reduction
数据降维主要是有两个动机:
- 数据压缩Data Compression
- 数据可视化Da