- 博客(3)
- 收藏
- 关注
原创 自适应动态规划学习笔记(3)
@TOC 自适应动态规划学习笔记(3)第三天ADP的三个部分&emnp;书接上回,上图展示了ADP的三个基本的组成,其中Critic Network输出对函数$J$的估计值
2021-03-31 21:38:22 1543 2
原创 自适应动态规划学习笔记(2)
@[toc]自适应动态规划学习笔记(2)第二天动态规划的基本原则是贝尔曼的最优性原则,简单描述为: 多级决策过程的最优策略,不论其初始状态和初始决策如何,当把其中任何一级和状态作为初始级和初始状态时,其剩余的决策对此也必定是一个最优策略An optimal (control) policy has the property that no matter what previous decisions have been, the remaining decisions must constitut
2021-03-30 21:36:03 1211
原创 自适应动态规划学习笔记(一)
@[TOC]自适应动态规划学习笔记(一)第一天 假设如下非线性离散系统xk+1=F(xk,uk),k=0,1,⋯ ,(1)x_{k+1}=F(x_{k},u_{k}),k=0,1,\cdots,\tag{1}xk+1=F(xk,uk),k=0,1,⋯,(1)其中xk∈Rnx_k\in R^{n}xk∈Rn是状态向量(state vector),uk∈Rmu_k\in R^{m}uk∈Rm表示控制向量(control vector),F:Rn×Rm→RnF:R^{n}\times R^{m}
2021-03-29 22:01:46 1266 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人