微分动态规划的基本思想

最新推荐文章于 2024-08-04 13:19:10 发布

jbluesun

最新推荐文章于 2024-08-04 13:19:10 发布

阅读量4.3k

点赞数 5

分类专栏： AI RL 强化学习增强学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jbluesun/article/details/76565767

版权

AI 同时被 3 个专栏收录

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

吴恩达cs229第19课，微分动态规划这一部分，看了两遍才看明白。

赶紧记下来：

微分动态规划是基于LQR（线性二次型）的，

后者能够比较简洁地计算最优策略，但要基于一个前提，就是 t+1 时刻的状态，是 t 时刻的状态和 t 时刻采取行为的线性函数。

然而，有很多控制系统，它的t+1的状态是 t 时刻状态和行为的“非”线性函数（下文称为“状态转换函数”）。

没关系，我们可以做线性近似，其实就是在真实的状态转换函数找个固定点，近似认为状态转换函数是这个经过这个点与真实函数相切的线性函数，这样就又可以用LQR了。

这样近似的话，下一个问题就是找哪个固定点（切点）呢？

对于一些控制问题，如果控制过程正常，大部分状态和行为都在某个小的局部范围之内，那么我们可以选择这个局部中心作为上述固定点。

但另一些控制问题，整个控制过程会沿着转换函数有较大的变化，这时候要还想用线性二次型这种简洁地算法做基本算法，那么就可以用微分动态规划的思路。简单说，就是在真实的状态转换函数的多个点（切点）上做线性近似，每一步（每个时间点）使用一个专用的切点。

那么，每一步用哪个切点呢？我们就要看看每一步“大概”会处在什么状态和选择什么行为，但我们还没有算出最优策略，怎么知道每一步在哪里？好，我们用个“将就”能用的非优策略作为起点，用这个非优策略先虚拟地控制一遍，产生一个“名义轨迹”（原文 nominal trajactory），在这个轨迹上的每一步，就是“大概”每一步的状态和所选择的行为了，这些“大概”的状态和行为，就可以作为线性近似函数的切点。然后，以这一组状态转换近似函数（每一步一个近似函数，LQR算法是支持“随时间而变的状态转换函数”的）就是下一轮迭代的基础。每次迭代下来，名义轨迹会越来越接近我们的控制过程要达到的目标轨迹。

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

jbluesun CSDN认证博客专家 CSDN认证企业博客

码龄22年

8: 原创

56万+: 周排名

31万+: 总排名

2万+: 访问

: 等级

321: 积分

12: 粉丝

23: 获赞

9: 评论

23: 收藏

私信

关注

热门文章

分类专栏

mySql 1篇
c++ 2篇
架构高质量代码
python 1篇
数据分析 1篇
管理 1篇
高质量代码
AI 1篇
RL 1篇
强化学习 1篇
增强学习 1篇

最新评论

tensorflow 的2.15版能解决安装tf的痛吗？
皇家肆掠者: 真假的，我试试
tensorflow 的2.15版能解决安装tf的痛吗？
amuro_ray027: 是的，按照官方的说法，由于windows支持wsl了，windows用户可以在wsl上使用GPU版本的tensorflow Note: GPU support on native-Windows is only available for 2.10 or earlier versions, starting in TF 2.11, CUDA build is not supported for Windows. For using TensorFlow GPU on Windows, you will need to build/install TensorFlow in WSL2 or use tensorflow-cpu with TensorFlow-DirectML-Plugin https://tensorflow.google.cn/install/source_windows?hl=en#gpu
tensorflow 的2.15版能解决安装tf的痛吗？
weixin_566: tensorflow 2.10版本后好像不提供windows的GPU支持了
tensorflow 的2.15版能解决安装tf的痛吗？
Hiroshi_yang: 您好请问现在的2.15版本是不是只提供了linux的GPU版本啊，windows一直无法识别到GPU，只能用CPU。
tensorflow 的2.15版能解决安装tf的痛吗？
Lloyd_0: 您好我想请问下这种方法安装之后验证虽然成功返回张量了但是系统中并无nvcc 这种方法分安装的cuda是以软件包形式与tensorflow共存的还是若其他的需要使用cuda还是需要按照传统方法再安装一次cuda和cudnn吗

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。