基于马尔可夫决策过程的运动规划-学习记录

最新推荐文章于 2024-01-24 10:44:12 发布

陳林325

最新推荐文章于 2024-01-24 10:44:12 发布

阅读量1.4k

点赞数 8

分类专栏：路径规划算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44558122/article/details/118530985

版权

路径规划算法专栏收录该内容

13 篇文章 34 订阅

订阅专栏

基于马尔可夫决策过程的运动规划-学习记录

0.前言
1.规划中的不确定性(Uncertainites in Planning)
2.不确定性下的规划(Planning with Uncertainites)
- 2.1 Decision Makers(Game Player)
- 2.2 Game的两种分类
- 2.3 两种不同的解法: Worst-Case-Analysis, Expected-Case-Analysis
- 2.4 在多步情况下的正式定义
3.马尔可夫决策过程(Markov Decision Process)
- 3.1 MDP介绍
- 3.2 MDP做规划的相关定义
4.极大/极小代价函数的规划(Minimax Cost Planning)
- 4.1 相关描述
- 4.2 递归关系寻找过程
- 4.3 算法1:Nondeterministic Dijkstra
- 4.4 算法优缺点
5.期望价函数的规划(Expected Cost Planning)
- 5.1 相关描述
- 5.2 递归关系寻找过程
- 5.3 算法2: Value Iteration
- 5.4 算法优缺点
6.实时动态规划(Real Time Dynamic Programming)
7.参考引用

0.前言

时间紧迫,来不及再敲一遍,直接上图,字写的比较丑…希望不会影响理解内容,中间可能会有一些记录不够清楚的地方,请留言讨论.

1.规划中的不确定性(Uncertainites in Planning)

在这里插入图片描述

2.不确定性下的规划(Planning with Uncertainites)

2.1 Decision Makers(Game Player)

在这里插入图片描述

2.2 Game的两种分类

在这里插入图片描述

2.3 两种不同的解法: Worst-Case-Analysis, Expected-Case-Analysis

在这里插入图片描述

2.4 在多步情况下的正式定义

在这里插入图片描述

3.马尔可夫决策过程(Markov Decision Process)

3.1 MDP介绍

在这里插入图片描述

3.2 MDP做规划的相关定义

在这里插入图片描述

4.极大/极小代价函数的规划(Minimax Cost Planning)

4.1 相关描述

在这里插入图片描述

4.2 递归关系寻找过程

在这里插入图片描述

4.3 算法1:Nondeterministic Dijkstra

在这里插入图片描述

思考问题可以参考CMU的机器人决策规划课程的课件：Planning under Uncertainty: Minimax Formulation.

4.4 算法优缺点

在这里插入图片描述

5.期望价函数的规划(Expected Cost Planning)

5.1 相关描述

在这里插入图片描述

5.2 递归关系寻找过程

在这里插入图片描述

5.3 算法2: Value Iteration

在这里插入图片描述

5.4 算法优缺点

在这里插入图片描述

6.实时动态规划(Real Time Dynamic Programming)

在这里插入图片描述

7.参考引用

1.深蓝学院<<移动机器人运动规划>>;
2.CMU课程《Planning & Decision-making in Robotics》部分课件：Planning under Uncertainty: Minimax Formulation.

关注

8
点赞
踩
19

收藏

觉得还不错? 一键收藏
9
评论
基于马尔可夫决策过程的运动规划-学习记录

基于马尔可夫决策过程的运动规划-学习记录0.前言1.规划中的不确定性(Uncertainites in Planning)2.不确定性下的规划(Planning with Uncertainites)        2.1 Decision Makers(Game Player)        2.2 Game的两种分类&nbsp
复制链接

扫一扫

专栏目录

陳林325 CSDN认证博客专家 CSDN认证企业博客

码龄5年

19: 原创

51万+: 周排名

158万+: 总排名

7万+: 访问

: 等级

732: 积分

420: 粉丝

261: 获赞

215: 评论

1329: 收藏

私信

关注

热门文章

分类专栏

Apollo 8篇
路径规划算法 13篇
ROS 5篇

最新评论

Apollo6.0代码Lattice算法详解——Part 7: 获得最优轨迹
晚来有灯: 你好，我感觉InCollision 里的ego_box.Shift(shift_vec); 应该是将Box的中心从后轴中心转到自车几何中心，因为计算角点用的是半车长，半车宽。所以自车在当前轨迹点的场景应该是自车后轴中心和轨迹点重合。这样理解对不对
基于马尔可夫决策过程的运动规划-学习记录
陳林325: sorry没有哦，mpc的话网上有很多写的不错的笔记的
基于ROS的A*算法代码学习
Linchat: 显示不出来visitednode是因为您的demo_node.cpp的125行的id是/world，应该把“/”就可以了
基于马尔可夫决策过程的运动规划-学习记录
小小青年&: 博主您好，模型预测控制在运动规划的应用这章还有笔记嘛？很期待
基于ROS的A*算法代码学习
粒子加速器～: 您好，我也是这个问题，请问一下，这是那个地方出问题

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。