自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 自适应动态规划学习笔记(3)

@TOC 自适应动态规划学习笔记(3)第三天ADP的三个部分&emnp;书接上回,上图展示了ADP的三个基本的组成,其中Critic Network输出对函数$J$的估计值

2021-03-31 21:38:22 1543 2

原创 自适应动态规划学习笔记(2)

@[toc]自适应动态规划学习笔记(2)第二天动态规划的基本原则是贝尔曼的最优性原则,简单描述为: 多级决策过程的最优策略,不论其初始状态和初始决策如何,当把其中任何一级和状态作为初始级和初始状态时,其剩余的决策对此也必定是一个最优策略An optimal (control) policy has the property that no matter what previous decisions have been, the remaining decisions must constitut

2021-03-30 21:36:03 1211

原创 自适应动态规划学习笔记(一)

@[TOC]自适应动态规划学习笔记(一)第一天 假设如下非线性离散系统xk+1=F(xk,uk),k=0,1,⋯ ,(1)x_{k+1}=F(x_{k},u_{k}),k=0,1,\cdots,\tag{1}xk+1​=F(xk​,uk​),k=0,1,⋯,(1)其中xk∈Rnx_k\in R^{n}xk​∈Rn是状态向量(state vector),uk∈Rmu_k\in R^{m}uk​∈Rm表示控制向量(control vector),F:Rn×Rm→RnF:R^{n}\times R^{m}

2021-03-29 22:01:46 1266 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除