数据压缩第二次作业

主成分分析

原理:主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析的方法。从数学角度来看,这是一种降维处理技术。一个研究对象,往往是多要素的复杂系统。利用原变量之间的相关关系,用较少的新变量代替原来较多的变量,并使这些少数变量尽可能多的保留原来较多的变量所反映的信息,这样问题可以大大简化。

步骤:1.我们一般选择一行是一个特征,对每个特征求平均值;原来的数据减去平均值得到新的中心化之后的数据;2.求特征协方差矩阵;3.根据协方差矩阵,求特征值与特征向量4.对特征值按照降序的顺序排列,相应的也给出特征向量,选择几个主成分,求投影矩阵。5.根据投影矩阵求出我们降维后的数据。

应用:可以用PCA做数据可视化和图像压缩

代码实现:
在这里插入图片描述

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值