PCA --理解及鸢尾花实践(sklearn)

简介

PCA:主成分分析(Principal components analysis)
主要是通过对协方差矩阵进行特征分解,以得出数据的主成分(特征向量)与它们的权值(特征值),它提供了一种降低数据维度的有效办法;如果分析者在原数据中除掉最小的特征值所对应的成分,那么所得的低维度数据必定是最优化的(也即,这样降低维度必定是失去讯息最少的方法)。
其数学定义为: 一个正交化线性变换,把数据变换到一个新的坐标系统中,使得这一数据的任何投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。

总结: PCA可以从数据中识别主要特征,通过将数据坐标轴旋转到数据角度上那些最重要的方向(方差最大),然后通过特征值分析,确定出需要保留的主成分个数,去除多余的信息和噪声,从而实现数据的降维,这个特点使得PCA可以处理一些特征较多的数据,例如人脸。

PCA主要算法

  1. 计算样本每个特征的平均值
  2. 用每个样本数据减去该特征的平均值;
  3. 求协方差矩阵;
  4. 找到协方差矩阵的特征值和特征向量;
  5. 对特征值和特征向量重新排列(特征值从大到小排列);
  6. 选取前n个特征作为主成分
  7. 利用投影矩阵,得到降维数据

Iris数据集处理

先画个3D图看一下

在这里插入图片描述
看一下数据集:(我是从本地导入)

import pandas as pd

df = pd
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值