动态规划学习笔记

只是笔记,提炼了很多。

1、对象和特点:多阶段决策过程,动态包括状态和决策。

2、无后效性(马尔科夫性)指系统从某阶段后的发展完全由本阶段所处的状态及其往后的决策决定,与系统以前的状态和决策无关。

3、定期和不定期的多阶段决策过程。

4、顺序:枚举、隐形枚举(在有效的条件下枚举)。

                逆序、会较方便。

5、综合考虑直接效果、简介效果。

6、状态转移方程。

7、建立动态规划模型的基本条件:

1)状态变量的特点:描述过程的变化、无后效性、可知性。

2)决策变量及允许决策集合。

3)状态转移函数。

4)目标函数的关系满足递推性。

8、每个最优策略只能有最优子策略构成。

9、一般当初始状态给定时用逆推比较方便,当终止状态给定时用顺推。

10、函数迭代和策略迭代。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值