无人驾驶之概率机器人，附加部分，及强化学习试卷

最新推荐文章于 2022-05-29 18:42:38 发布

吴家征

最新推荐文章于 2022-05-29 18:42:38 发布

阅读量646

点赞数 3

分类专栏：概率机器人学文章标签：强化学习无人驾驶人工智能机器学习概率机器人学

本文链接：https://blog.csdn.net/qq_38588806/article/details/88118570

版权

概率机器人学专栏收录该内容

6 篇文章 5 订阅

订阅专栏

注：本卷为内部用卷，供大家检验学习成果用，如需商业化请私聊我，谢谢!

注：本卷可结合博文的考纲使用
一、填空题（60分，定义，区别2分，其他1分）

概率机器人与传统机器人相比的优势在于___________________________________,
________________________________。
概率机器人即近视醉酒倒霉机器人，近视表现为____________________________,
醉酒表现为________________________，倒霉表现为____________________________。
多维高斯分布表达式为___________________，其协方差表示___________________。
满足马尔可夫假设即________________________________________________________。
高斯参数滤波方法有______________, __________, __________。非参数滤波方法有
____________, ____________。
IF算法相比KF算法的优点是________________________________________________。
密度树的定义是_____________________________________________________________，
选择更新的方法是___________________________________________________________。
静态二值贝叶斯滤波的表达式是______________________________，公式中各部分的意义是____________________________________________________________________，
它在建图中的应用思想是____________________________________________________。
三角形分布的表达式是______________________________。
估计一致性的定义是________________________________________________________。
对称环境测试是指___________________________________________________________。
AMCL实质是__________和____________原理的叠加加上对粒子流分布的限制。
可以用于行为克隆的是____________模型,正演模型用MAP的原因是_________，
_________________________________________。
Gmapping的G指的是____________, 其定位用的是_______滤波。
Qlearning与sarsa的区别是__________________________________________________。
强化学习根据需要亲身经历分为__________与__________。根据更新方法分为__________与___________。根据策略是否相同分为_____________与_____________。根据时间是否同步分为_________与_________。
sarsa的收敛条件是________________，sarsa(langda)与之的区别是__________________。
交叉熵的定义式是__________________，
POMDP的定义是___________________________________________________________。

二、应用题（170分）
21. 解释下图各个部分的意义（14分）

23.高斯滤波系的KF系在机器人定位中有着重要应用，请回答下列问题。（25分）
（1）解释2-7的意义（6分）

（2）解释2-14的意义（13分）

（3）KF,EKF,UKF的区别是什么，影响EKF,UKF的性能的主要因素分别是什么?（6分）

粒子滤波是目前比较流行滤波方法，请回答下列问题。（44分）
（1）解释2-20的意义（19分）

（2）解释2-20的意义（19分）

（3）上述两者有什么区别？（6分）
在机器人感知中，我们常常用到波速模型表示测量的置信分布，试回答下列问题。（16分）

（1）画出波束模型的四大组成部分及最后的综合模型并写出这5个图形的数学表达式。（10分）

（2）如下图，圆是激光雷达，方块是障碍物，根据波束模型大致画出障碍物的似然域分布。（6分）

25. 强化学习目前结合深度学习产生了许多结合的变种，如DDPG（深度+确定+policy gradients），DQN（深度网络+Qlearning），A3C,DDPO等，请回答下列问题。（41分）
（1）简述DQN的基本思想，其相比QLearing有哪些改进？（8分）

（2） DQN有哪些变种，其变种的改进部分及优势是？（9分）

（3） DQN估计网络与真实网络的参数如何更新？与DDPG有哪些不同？（6分）

（4）简述PG的基本思想，其与Qlearning有哪些不同？（8分）

（5）在AC算法中，actor指的是？critic指的是?其基本思想是?（10分）

6.Gmapping的框图如图所示，请简述gmapping的原理。（15分）

7.已知路径规划分为局部路径规划及全局路径规划，请叙述任意两种局部路径规划的方法，并说明在全局路径规划中A*相比于迪杰斯特拉算法有何改进。（15分）

三、计算题（70分）

已知一片栅格的直方图概率分布如下，其表示置信度的预测，若P(Zt|Xt)服从均值为(0,0),方差为（1,1），ρ为0.5的二维高斯分布，求其经过直方图滤波后的置信度直方图概率分布。并简述分辨率是什么，对直方图滤波有何影响（需归一化）（12分）
已知R矩阵如下图，Q矩阵默认为0，试迭代计算10次Q矩阵。衰减系数0.2，学习率0.1（10分）
试利用迪杰斯特拉算法计算下列图1到6的最短路径（15分）
已知，
(1)试将其推导成下列形式（18分）

（2）试考虑激光雷达地图的影响，将其推导成下列形式（要用到近似）。（15分）

吴家征

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
无人驾驶之概率机器人，附加部分，及强化学习试卷

注：本卷为内部用卷，供大家检验学习成果用，如需商业化请私聊我，谢谢! 注：本卷可结合博文的考纲使用一、填空题（60分，定义，区别2分，其他1分）概率机器人与传统机器人相比的优势在于___________________________________,________________________________。概率机器人即近视醉酒倒霉机器人，近视表现为____________...
复制链接

扫一扫

专栏目录