无人驾驶之概率机器人,附加部分,及强化学习试卷

注:本卷为内部用卷,供大家检验学习成果用,如需商业化请私聊我,谢谢!

注:本卷可结合博文的考纲使用
一、 填空题(60分,定义,区别2分,其他1分)

  1. 概率机器人与传统机器人相比的优势在于___________________________________,
    ________________________________。
  2. 概率机器人即近视醉酒倒霉机器人,近视表现为____________________________,
    醉酒表现为________________________,倒霉表现为____________________________。
  3. 多维高斯分布表达式为___________________,其协方差表示___________________。
  4. 满足马尔可夫假设即________________________________________________________。
  5. 高斯参数滤波方法有______________, __________, __________。非参数滤波方法有
    ____________, ____________。
  6. IF算法相比KF算法的优点是________________________________________________。
  7. 密度树的定义是_____________________________________________________________,
  8. 选择更新的方法是___________________________________________________________。
  9. 静态二值贝叶斯滤波的表达式是______________________________,公式中各部分的意义是____________________________________________________________________,
    它在建图中的应用思想是____________________________________________________。
  10. 三角形分布的表达式是______________________________。
  11. 估计一致性的定义是________________________________________________________。
  12. 对称环境测试是指___________________________________________________________。
  13. AMCL实质是__________和____________原理的叠加加上对粒子流分布的限制。
  14. 可以用于行为克隆的是____________模型,正演模型用MAP的原因是_________,
    _________________________________________。
  15. Gmapping的G指的是____________, 其定位用的是_______滤波。
  16. Qlearning与sarsa的区别是__________________________________________________。
  17. 强化学习根据需要亲身经历分为__________与__________。根据更新方法分为__________与___________。根据策略是否相同分为_____________与_____________。根据时间是否同步分为_________与_________。
  18. sarsa的收敛条件是________________,sarsa(langda)与之的区别是__________________。
  19. 交叉熵的定义式是__________________,
  20. POMDP的定义是___________________________________________________________。

二、 应用题(170分)
21. 解释下图各个部分的意义(14分)
s
23.高斯滤波系的KF系在机器人定位中有着重要应用,请回答下列问题。(25分)
(1)解释2-7的意义(6分)
s
(2)解释2-14的意义(13分)
ss
(3)KF,EKF,UKF的区别是什么,影响EKF,UKF的性能的主要因素分别是什么?(6分)

  1. 粒子滤波是目前比较流行滤波方法,请回答下列问题。(44分)
    (1) 解释2-20的意义(19分)
    ss
    (2) 解释2-20的意义(19分)
    dd
    (3) 上述两者有什么区别?(6分)

  2. 在机器人感知中,我们常常用到波速模型表示测量的置信分布,试回答下列问题。(16分)

(1)画出波束模型的四大组成部分及最后的综合模型并写出这5个图形的数学表达式。(10分)

(2) 如下图,圆是激光雷达,方块是障碍物,根据波束模型大致画出障碍物的似然域分布。(6分)
ss
25. 强化学习目前结合深度学习产生了许多结合的变种,如DDPG(深度+确定+policy gradients),DQN(深度网络+Qlearning),A3C,DDPO等,请回答下列问题。(41分)
(1) 简述DQN的基本思想,其相比QLearing有哪些改进?(8分)

(2) DQN有哪些变种,其变种的改进部分及优势是?(9分)

(3) DQN估计网络与真实网络的参数如何更新?与DDPG有哪些不同?(6分)

(4) 简述PG的基本思想,其与Qlearning有哪些不同?(8分)

(5) 在AC算法中,actor指的是?critic指的是?其基本思想是?(10分)

6.Gmapping的框图如图所示,请简述gmapping的原理。(15分)
ss

7.已知路径规划分为局部路径规划及全局路径规划,请叙述任意两种局部路径规划的方法,并说明在全局路径规划中A*相比于迪杰斯特拉算法有何改进。(15分)

三、 计算题(70分)

  1. 已知一片栅格的直方图概率分布如下,其表示置信度的预测,若P(Zt|Xt)服从均值为(0,0),方差为(1,1),ρ为0.5的二维高斯分布,求其经过直方图滤波后的置信度直方图概率分布。并简述分辨率是什么,对直方图滤波有何影响(需归一化)(12分)
    ss

  2. 已知R矩阵如下图,Q矩阵默认为0,试迭代计算10次Q矩阵。衰减系数0.2,学习率0.1(10分)
    hh

  3. 试利用迪杰斯特拉算法计算下列图1到6的最短路径(15分)
    dd

  4. 已知 ,ss
    (1)试将其推导成下列形式(18分)
    ss
    (2)试考虑激光雷达地图的影响,将其推导成下列形式(要用到近似) 。(15分)
    ss

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值