机器学习数据增加_【机器学习】数据降维概述

wyj耶

于 2021-01-30 17:10:17 发布

阅读量224

点赞数

文章标签：机器学习数据增加

本文链接：https://blog.csdn.net/weixin_32566515/article/details/113450807

版权

机器学习领域中所谓的降维就是指采用某种映射方法，将原高维空间中的数据点映射到低维度的空间中。

维数 (又称维度)

例 “点是0维、直线是1维、平面是2维、体是3维”

又如，像素数字放入像素白板

实际上中，可以通过如下操作增加维数：

这些变换的因素是潜变量(Latent Variables)，潜变量在。

为什么要降维？
- 在原始的高维空间中，包含冗余信息和噪声信息，会在实际应用中引入误差，影响准确率；而降维可以提取数据内部的本质结构，减少冗余信息和噪声信息造成的误差，提高应用中的精度。
降维的好处
- 直观地好处是维度降低了，便于计算和可视化，其更深层次的意义在于有效信息的提取综合及无用信息的摈弃。
一个简单的例子

含有噪声的数据

低冗余数据

高冗余数据
- 冗余
- 噪声：选择一个方向投影过滤噪声
降维

高冗余数据
- 利用某种映射将原高维度空间的数据点投影到低维度的空间：
降维的本质
- 学习一个映射函数，其中是原始数据点的表达，目前最多使用向量表达形式。是数据点映射后的低维向量表达，通常的维度小于的维度(当然提高维度也是可以的)。可能是显式的或隐式的、线性的或非线性的。

关注