主成分分析 一个非监督的机器学习算法主要用于数据的降维通过降维,可以发现更便于人类理解的特征其他应用:可视化;去噪 对于上图,如何找到这个样本间间距最大的轴?如何定义样本间间距?使用方差 找到一个轴,使得样本空间的所有点映射到这个轴后,方差最大 将样例的均值归为0(demean)【所有样本减去这批样本的均值】 此时 即 此时 这就成了一个目标函数的最优化问题,可以使用梯度上升法解决。 不要将 PCA 和 线性回归 搞混了