以LeetCode 上的「1575. 统计所有可行路径」为例
记忆化搜索
缓存器的设计十分简单,使用二维数组cache[][]进行记录即可。
我们用cache[i][fuel]代表从位置 i 出发,当前剩余的油量为 fuel 的前提下,到达目标位置的「路径数量」。
之所以能采取「缓存中间结果」这样的做法,是因为「在 i 和 fuel 确定的情况下,其到达目的地的路径数量是唯一确定的」。
动态规划
dfs方法签名设计
int dfs(vector<int>& ls, int u, int end, int fuel) {}
其中ls参数和end参数在整个DFS过程中不会变化,属于不变参数;
而u和fuel则代表了DFS过程中的当前位置和当前油量,属于变化参数;
因此我们可以定义一个二维数组dp[][]来分别表示两个可变参数;
第一维代表当前位置,第二维代表当前剩余油量;
二维数组中储存的就是DFS方法返回的值(路径数量);
如此一来便可得到「动态规划」的「状态定义」;
dp[i][j]代表从 i 位置出发,当前剩余油量为 j 的前提下,到达目的地的路径数量;
不知道你是否发现,这个「状态定义」和我们「记忆化搜索」中的缓存器的定义是一致的。
接下来我们要从 DFS 中”翻译“出「状态转移方程」。
所谓的「状态转移方程」其实就是指如何从一个状态转移到另外一个状态。
而我们的 DFS 主逻辑就是完成这个转移的。
DFS 中的主逻辑很简单:枚举所有的位置,看从当前位置 u 出发,可以到达的位置有哪些。
于是我们很容易就可以得出状态转移方程:
dp[i][fuel]=dp[i][fuel]+dp[k][fuel-need];
k代表计算位置 i ,油量 fuel 的状态时枚举的「下一位置」,need 代表从 i 到达 k 需要的油量;
从状态转移方程可以发现,在计算dp[i][fuel]的时候依赖于dp[k][fuel-need];
其中 i 与 k 并无严格的大小关系,而 fuel 和 fuel 和 need 具有严格的大小关系(fuel>=fuel-need)
因此我们需要先从小到大枚举油量这一维。
至此,我们只利用 DFS 的方法签名与主逻辑,就写出了「动态规划」解法。
总结:
1. 从 DFS 方法签名出发。分析哪些入参是可变的,将其作为 DP 数组的维度;将返回值作为 DP 数组的存储值。
2. 从 DFS 的主逻辑可以抽象中单个状态的计算方法。
其中第一点对应了「动态规划」的「状态定义」,第二点对应了「动态规划」的「状态方程转移」。