降维—PCA

PCA(主成分分析)是一种常用的降维技术,通过映射数据到新的特征空间,减少维度的同时保持数据的信息量。其目标是提升算法效率和数据可视化,衡量指标为样本方差。PCA通过矩阵分解实现,例如将二维数据降至一维。降维不同于特征选择,前者产生与原始特征不同的新特征。PCA在数据可视化、降噪和识别关键特征(如人脸识别)等领域有广泛应用。
摘要由CSDN通过智能技术生成

1. 定义:将现有特征映射到一个新的特征空间中,然后得到新的特征。 特点:维度降低,数据改变。

2. 目的:算法运算更快效果更好;数据可视化

3. 衡量指标:样本方差,又称可解释性方差,方差越大,特征所带的信息量越多。
在这里插入图片描述

其中,Var表示某特征的方差,n代表样本量,xi表示某特征中的各样本 取值,x’代表该特征对应样本的均值。

4. 方法:矩阵分解。用来找出n个新特征向量,让数据能够被压缩到少数特征上并且总信息量不损失太多的技术。

5. 操作过程

**加粗样式**

6. 举例

在这里插入图片描述

原数据是二维的(x1和x2),找到新的特征空间(x1’和x2’

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值