漩涡杰瑞-CSDN博客

原创自适应动态规划学习笔记（3）

@TOC 自适应动态规划学习笔记（3）第三天 ADP的三个部分 &emnp;书接上回，上图展示了ADP的三个基本的组成，其中Critic Network输出对函数$J$的估计值

2021-03-31 21:38:22 1747 2

@[toc]自适应动态规划学习笔记（2）第二天动态规划的基本原则是贝尔曼的最优性原则，简单描述为：多级决策过程的最优策略，不论其初始状态和初始决策如何，当把其中任何一级和状态作为初始级和初始状态时，其剩余的决策对此也必定是一个最优策略 An optimal (control) policy has the property that no matter what previous decisions have been, the remaining decisions must constitut

2021-03-30 21:36:03 1352

原创自适应动态规划学习笔记（一）

@[TOC]自适应动态规划学习笔记（一）第一天假设如下非线性离散系统 xk+1=F(xk,uk)，k=0,1,⋯ ,(1)x_{k+1}=F(x_{k},u_{k})，k=0,1,\cdots,\tag{1}xk+1=F(xk,uk)，k=0,1,⋯,(1) 其中xk∈Rnx_k\in R^{n}xk∈Rn是状态向量（state vector）,uk∈Rmu_k\in R^{m}uk∈Rm表示控制向量（control vector）,F:Rn×Rm→RnF:R^{n}\times R^{m}

2021-03-29 22:01:46 1400 1