训练数据集中num415和num857这两组数据的相关系数大于0.8。
从上图可以直观地看到num415和num857的强相关性。
上图简介了PCA方法的一点起源以及该方法的一些优点。
从上图可以看出,num415和num857这两组数据的和分布在较广的范围,而num415和num857这两组数据的差大部分为0,因而二者之和可以反映出两组数据更多的信息。
从而可以理解PCA算法中为什么要让方差尽可能地大。
二、工具包的使用
三、预处理
训练数据集中num415和num857这两组数据的相关系数大于0.8。
从上图可以直观地看到num415和num857的强相关性。
上图简介了PCA方法的一点起源以及该方法的一些优点。
从上图可以看出,num415和num857这两组数据的和分布在较广的范围,而num415和num857这两组数据的差大部分为0,因而二者之和可以反映出两组数据更多的信息。
从而可以理解PCA算法中为什么要让方差尽可能地大。
二、工具包的使用
三、预处理