
强化学习
文章平均质量分 87
Tipriest_
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
动态规划的核心性质——最优化原理 (Principle of Optimality)
最优化原理最早由动态规划的提出者、美国数学家理查德·贝尔曼 (Richard Bellman) 提出。“一个最优策略的子策略,对于它所对应的子问题来说,也必须是最优的。如果一个大问题的最优解包含了一个小问题的解,那么这个小问题的解也必须是它本身的最优解。换句话说,最优解的组成部分也必须是局部的最优解。最优化原理(Optimal Substructure):关注的是解的结构。它断言全局最优解可以由局部最优解构建而成。这是我们能够写出状态转移方程的理论依据。无后效性(No Aftereffect)原创 2025-07-16 20:26:52 · 834 阅读 · 0 评论 -
动态规划的无后效性与马尔可夫性质相似关系的说明
无后效性是动态规划能够成立的关键性质之一。“未来与过去无关”:一旦某个阶段的状态给定,那么在这个状态之后的过程演变,就不再受到这个状态之前阶段的影响。“只看现在”:当我们在做当前阶段的决策时,我们只需要关心当前的状态是什么,而不需要关心我们是如何到达这个状态的。当前状态已经包含了所有对未来决策有用的信息。举个例子:走方格问题在一个m x n的网格中,从左上角(0, 0)走到右下角(m-1, n-1),每次只能向下或向右走,求有多少种走法?状态定义dp[i][j]表示到达格子(i, j)的路径总数。原创 2025-07-16 20:00:21 · 901 阅读 · 0 评论