人工智能学习(十一):机器人学

目录

10.1 机器人的类别

10.2 交互中的不确定性来源

10.2.1 处理运动行动中的不确定性

10.3 定位

10.4 绘图

10.5 传感器上的贝叶斯推理

10.6 运动规划


10.1 机器人的类别

操纵器:

机器人的配置由6个数字指定 \Rightarrow 6个自由度(DOF)

6是任意定位末端执行器所需的最小数量。对于动态系统,为每个自由度增加速度。

移动机器人:

非人体工程学的机器人:

一辆汽车有更多的DOF(3)而不是控制(2),所以是不符合人体工程学的。
通常不能在两个无限接近的配置之间转换。

10.2 交互中的不确定性来源

对于任何互动的移动代理(人类或机器人),有两个主要的不确定性来源。

  • 他们所感知到的一切(感知)
  • 他们所做的一切(行动)

所有这些误差都会无限制地累积起来。

因此,从完美的知识开始,使用误差非常小的动作移动,在一个无限长的动作序列之后,一个系统将在其位置估计上有无限的误差。

10.2.1 处理运动行动中的不确定性

使用传感器来验证行动(不简单)。

让我们来看看一个非常简单的传感器——距离传感器(激光测距仪)。

返回一个数字,与直线路径上最近的障碍物相对应,直到某个有限的距离。

有一些已知的误差(非精确的位置)。

有一些已知的假阳性/假阴性率(障碍物是否存在)。

有较小的空间范围——如果有部分障碍物怎么办?

有限的时间意味着不能检查每个位置,一个读数对邻近点的读数有什么意义。


传感器:

测距仪:声纳(陆地、水下)、激光测距仪、雷达(飞机)、触觉传感器、GPS

成像传感器:照相机(视觉、红外)。

本体感觉传感器:轴解码器(关节、车轮)、惯性传感器、力传感器、扭矩传感器


传感器的不确定性的影响:

必须对世界的行为方式做出假设,才能对读数进行解释。比如说:

  • 一些有限分辨率的采样足以检测到障碍物(假设一个障碍物由数百个稀疏分布的长针脚组成,指向传感器)。
  • 必须了解机器人的结构才能判断障碍物是什么。
  • 给出一些传感器的读数,只有有限的概率是正确的——必须有一些方法来处理这个问题。

10.3 定位

在时间t的一个行动A_{t}导致

状态X_{t}+1和观测值Z_{t}+1

给出观察结果,计算当前位置和方向(姿势)。

传感器模型。使用对地标x_{i}y_{i}的观测h(x_{t})来估计机器人的状态x_{t}

运动模型。使用其运动v_{t}\Delta tw_{t}\Delta t更新状态。

假设有高斯噪声进行运动预测,传感器距离测量。


可以使用粒子过滤来产生近似的位置估计

从机器人位置的统一先验分布的随机样本开始。

使用传感器测量值更新每个样本的似然性。

根据更新的似然性重新取样。


我们需要使用最新的测量值不断更新当前状态的分布。

机器人的状态不确定性随着它的移动而增加,直到我们找到一个地标。

假设地标是可识别的,否则,后验是多模态的。

10.4 绘图

定位:给定地图和观察到的地标,更新姿势分布。

绘图:给定姿势和观察到的地标,更新地图分布。

同时定位和绘图(SLAM):

给定观察到的地标,更新姿态和地图分布。

SLAM的概率表述:

添加地标位置L_{1},...,L_{k}到状态向量,继续进行定位。


考虑有8个相同的地标的空间:

当再次检测到第一个地标时:机器人或地标位置没有不确定性。

10.5 传感器上的贝叶斯推理

需要一些方法来确定一个障碍物是否存在,给定传感器的多个测量值。

什么是贝叶斯推理?(修订)

  • 一种在给定一组测量值的情况下,确定一个假设为真概率的方法。
  • 概率\approx信念度。

条件概率的要素(修订)

在条件B下,A是真的概率。P(A | B)

给定M的情况下H的概率是多少:

  • P(H | M):H的后验概率。
  • P(H)H的先验概率。
  • P(M | H):传感器模型。
  • P(M):正则化系数。

正则化:

P(M) = P(M | H)P(H) + P(M | \rightharpoondown H)P(\rightharpoondown H)


例子:

障碍物检测。

  • 有障碍物存在的几率是1/10。
  • 探测器有5%的假阳性率和10%的假阴性率。
  • 如果检测器返回阳性结果,障碍物存在的概率是多少?
  • 如果检测器反馈为负值,障碍物存在的概率是多少?

先验:

P(obstacle) = 0.1

P(noobstacle) = 0.9

传感器模型:

P(positive | obstacle) = 0.9

P(negative | obstacle) = 0.1

P(negative | notobstacle) = 0.95

P(positive | notobstacle) = 0.05

如果传感器返回正值:

P(obstacle | positive) = \frac{0.9}{0.9 \times 0.1 + 0.05 \times 0.9}0.1 = 0.667

如果传感器返回负值:

P(obstacle | negative) = \frac{0.1}{0.1 \times 0.1 + 0.95 \times 0.9}0.1 = 0.0116


贝叶斯法则的增量形式

贝叶斯定律可以被扩展到处理多个测量。

  • 给出一组独立的测量值\left \{ M_{j} \right \}
  • 假设H的概率是多少?

如果测量是独立的,可以使用增量形式。

  • 给出当前的概率分布P(H)
  • 和一个新的测量值M
  • 更新后的概率分布P(H)是什么?

使用增量形式的贝叶斯定律:


例子:

障碍物检测(再次)。

  • 有障碍物存在的几率是1/10。
  • 探测器有5%的假阳性率和10%的假阴性率。
  • 如果检测器返回,存在障碍物的概率是多少?
  • 一个阳性?
  • 两个阳性?
  • 两个阳性和一个阴性?

时间顺序:

10.6 运动规划

思路:在由机器人的DOF定义的配置空间中进行规划。

解决方案是自由C空间中的一个点轨迹。

基本问题:\infty ^{d}状态转换为有限状态空间。

单元分解:

将空间划分为简单的单元。

每个单元都可以 "轻松 "穿越(例如,凸形)。

骨架化:

确定构成一个图的有限数量的容易连接的点/线,这样图上的任何两个点都由一条路径连接。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值