高翔【自动驾驶与机器人中的SLAM技术】学习笔记(一)——流形;

新建了一个专栏,仔细学习高翔的新书《自动驾驶与机器人中的SLAM技术》。

快速通读了一遍,发现还有很多需要深入学习的东西,因此二刷这本书。对于自己不懂的地方,通过这个笔记记录这个流程。

第一个问题:流形。

深度学习之:什么是流形(manifold)?流形空间,流形学习_数据流形-CSDN博客

 二维空间中的圆就是一个一维流形。

流形可以作为一种数据降维的方式。

  • 流形学习的一个主要应用就是“非线性降维
  • 降维的过程中不但考虑到了距离,更考虑到了生成数据的拓扑结构

特征提取,特征学习。

数据因为固有的特性,导致无法“填满”整个高维空间。例如如果数据只能出现在三维空间中的一个球面上。那这个球面以外的空间永远不会有数据点。而一个表面我们完全可以只用两个参数来表示(经度、维度)。

 流形学习就是在考虑:

1,如何找到这个从高维到低维的映射

2,哪怕不能直接找到这个映射,那我们可以找到某种方法,在高维空间处理数据,等效于“将高维空间映射到低维空间、再处理数据、再映射回高维空间”的这种操作。




 流形学习 (Manifold Learning) - 范叶亮 | Leo Van

参照这个文章中的部分内容,增加对这个流形的认知。重点梳理一下。

流形是干嘛的:数据降维的,提取有用信息。是一种非线性降维算法。

同胚:映射f

嵌入

这个跟深度学习中,基于训练数据,求解模型一样。

这里表述为:根据观察数据,推测模型

不相似性:样本之间的距离。差异化度。

计算不相似性:样本之间的距离,进行降维。

再举个具体点的例子:在一个excel表中,每行代表一个样本,每列代表样本的一个特性。比如学生信息表:每行代表一个学生,每列代表一个特性,比如,年龄月份,出生地,父母情况,性别,身高,体重,各科成绩,身体素质,常患疾病,精神状态等等一堆指标,最终评价这个学生可否考上985。对于他们的不相似性的度量,就是那些特性的不同取值,如何计算。哪些特性占的权重比较大。寻找到主要成份。

就像一杯饮料,找到主要的味道。

  1. 中心矫正,求取均值(和方差),
  2. 特征分解
  3. 求取特征向量和特征值

多尺度变换MDS和PCA都是主成份分析的作用,都是数据降维

咱们不能无限往下挖,等到具体章节继续扩展这个地方。现在记住:非线性数据降维的方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值