今天换了一位新的老师,是长沙雅礼的朱全民老师,估计网易博友ydc就是他的得意门生吧! 今天主要就讲了动态规划(DP),讲了两类 DP,线形动态规划和集合动态规划(背包)。
先说一下基本概念吧。
阶段:把问题分成几个相互联系的有顺序的几个环节,这些环节即称为阶段。
状态:某一阶段的出发位置称为状态。通常一个阶段包含若干状态。
决策:从某阶段的一个状态演变到下一个阶段某状态的选择。
策略:由开始到终点的全过程中,由每段决策组成的决策序列称为全过程策略,简称策略。
状态转移方程:前一阶段的终点就是后一阶段的起点,前一阶段的决策选择导出了后一阶段的状态,这种关系描述了由k阶段到k+1阶段状态的演变规律,称为状态转移方程。
?目标函数与最优化概念:目标函数是衡量多阶段决策过程优劣的准则。最优化概念是在一定条件下找到一个途径,经过按题目具体性质所确定的运算以后,使全过程的总效益达到最优。
动规有两个重要的性质:
①最优化原理:
一个最优化策略具有这样的性质,不论过去状
态和决策如何,对前面的决策所形成的状态而
言,余下的诸决策必须构成最优策略。
简而言之,一个最优化策略的子策略总是最优
的。
最优化原理是动态规划的基础,任何问题,如
果失去了最优化原理的支持,就不可能用动态
规划方法计算。
②无后效性:
“
过去的步骤只能通过当前状态影响未来的发展
,当前的状态是历史的总结
”
。这条特征说明动
态规划只适用于解决当前决策与过去状态无关
的问题。状态,出现在策略任何一个位置,它
的地位相同,都可实施同样策略,这就是无后
效性的内涵。
举例:
最短路(不带负权边,带负权边)。
然后是动规的解题步骤:
①划分阶段:注意阶段一定要是有序的或者是可
排序的,否则问题就无法求解。
②选择状态:状态的选择要满足无后效性。
③确定决策:决策决定着状态的转移,状态转移
就是根据上一阶段的状态和决策来导出本阶段
的状态。
④写出状态转移方程(包括边界条件和取值范围
):根据问题的性质(求最大
/
最小),用数学
方程描述状态转移的方法和过程。
今天主要是这些概念的问题,也学习了怎样建立状态转移方程,就是这样。