降维(一)

动机一:压缩数据(Data Compression)

现假设有如下数据集,横坐标为特征变量x1,其单位为厘米(cm);纵坐标为特征变量x2,其单位为英寸(inches)。

 

我们知道这两个特征变量均为长度计量单位,同时使用不免重复。因此,我们需要将这个二维数据集降为一维数据集。

对于该问题降维的具体做法为:先找到一条合适的直线,然后将数据投影到这条直线上,最后我们将这些投影到直线上的数据用z(i)标识。

降维可以将对存储、内存占用空间减半,使得运行这些数据的算法运行得更快。

下图为三维数据集降为二维数据集的例子。

 

动机二:数据可视化

我们将数据可视化能让我们更为直观地找寻一个更好的解决方案。但对于维度较高的数据集,我们将其可视化是不可能的。因此,我们可以通过降维使得数据集可视化。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值