摘要:本次主要是公式的理解有点难度,可以去看看南瓜书。本次将乳腺癌数据训练集的划分,随机划分了10次,取其平均值。
1. 笔记
公式理解
- 理解PCA的相关知识以及结论,这张图作用很大:
- 从这张图可以看出:
- 往方差大的方向投影,点都是尽可能的散开,往方差小的方向投影,点都是尽可能聚集在一起,所以,如果往方差小的方向投影,有一个点,远离了大多数的点,那么,它是离群点的概率很大。
- 从周志华的书,以及南瓜书,来推导出下面的式子,得出方差与特征值线性相关,所以,方差等于特征值,协方差为0是因为不同特征值对应的特征向量正交,相乘为1,带入式子为0
2.Example
对乳腺癌数据的训练集划分,划分了10次,取平均值
将之前的数据的显示改为了散点图
参考文献、链接、联系方式
jupyter文档地址
邮箱:zhoumqcuriosity@163.com