机器学习课堂笔记(十四)
使用低维数据来近似表示高维数据
通过数据可视化来获得降维数据的物理意义
Σ
和
∑ni=1
不同
Σ
的计算对于所有的样本值
此时计算的是一个样本值
x(i)
的降维
z(i)
保留99%的差异性
[U,S,V] = svd(Sigma)调用一次
使用训练集运行PCA,这样定义了x-z的映射,可将其应用于测试集合交叉验证集
PCA应用于可视化时,k=2或k=3
使用PCA避免过拟合将会丢失信息
首先使用原始数据,当算法表现不好时再考虑PCA