主成分分析 PCA 应用实例 鸢尾花数据集

对鸢尾花数据集采用主成分分析方法,使数据降维。

如下图所示为数据集的格式:

          

 

  数据集中前4列数据分别代表花萼长度,花萼宽度,花瓣长度,花瓣宽度,最后一列为标签。共有150条数据。

  我们对此数据集利用主成分分析方法,取出数据集的前4列特征组成矩阵X, 矩阵X的维度为150*4,对其进行转置后变为4*150.

  第二步用X.T*X得到4*4维度的对称矩阵,我们就可以求这个对称矩阵的特征值lambda1,lambda2,lambda3,lambda4和对应的特征向量u1,u2,u3,u4。特征值一定是实数,特征向量之间是相互正交的。每个特征向量都是4*1的向量。

  第三步把特征值做一个从大到小的排列,取出前两个最大的特征值和对应的特征向量。如果说lambda1最大,也就是说u1是最主要的方向,是最主要的主成分。次大的特征值对应的特征向量是第二主成分,依次往下排列。

  假如说u1,u2是排列前2的主成分,那么就把样本数据都投影到u1和u2这个方向上,这是只有两维的数据了,并且u1,u2还是垂直的。可以把他看成新的特征选择或组合。效果如下:

         

由上图可知,投影后的数据可以很容易的对其进行分类。如下图所示:

 

转载于:https://www.cnblogs.com/carlber/p/10846725.html

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值