动态规划(入门)【不骗人,真的好理解的啦】(二)

7 篇文章 0 订阅
2 篇文章 0 订阅

这里写图片描述
恭喜,你已经成功地来到了

动态规划(入门)【不骗人,真的好理解的啦】(二)

那么接着上一次的问题(没有看过的可以看一下这一篇动态规划(入门)【不骗人,真的好理解的啦】(一)):我们用一家人传递水的事例来分析了什么叫作阶段与状态,
我们现在应该来讨论一下什么叫作决策。

决策

在对问题的处理中作出的每种选择性的行动就叫做决策。即从该阶段的每一个状态出发,通过一次选择性的行动转移至下一阶段的相应状态。
还是利用之前传水的例子:

这就好比你妈生了若干个child,然后让你们站成一排,让你的最大的哥哥/姐姐一直传一桶水到最状态小的口渴的弟弟或妹妹。

在这里面,每个人选择传,或不传(当然不传你妈打屎你跟你好好地谈人生)就叫做对这个传水的分问题的决策。

阶段变量,状态变量,决策变量

简单来说,阶段变量用来描述阶段的变量(tm这是什么解释),一般喜欢用k来表示 。在传水的例子中,假设你有10个兄弟姐妹,那么阶段变量就是k=1,2,3……10.
状态变量用来描述状态的变量(。。。),在传水的例子中,你兄弟姐妹的左右手都可以叫作状态变量(问:手怎么变??答:有没有力气啊!)
决策变量同理。

策略

在所以阶段构成的全过程中,各阶段的决策变量所组成的有序总体被称作策略。最优效果的策略叫作最优策略。
这时,我想到了中国策略第一家:
这里写图片描述
和他
这里写图片描述

状态转移方程

警告警告,如果不会状态转移方程,那动态规划就完蛋了

状态转移方程,是动态规划中本阶段的状态往往是上一阶段状态和上一阶段决策的结果。如果给定了第K阶段的状态Sk以及决策uk(Sk),则第K+1阶段的状态Sk+1也就完全确定。

很重要###!!

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值