常见的动态规划(一)-基础问题(1)
一、动态规划是什么?
动态规划,英⽂:Dynamic Programming,简称DP,如果某⼀问题有很多重叠⼦问题,使⽤动态规划 是最有效的。 所以动态规划中每⼀个状态⼀定是由上⼀个状态推导出来的,这⼀点就区分于贪⼼,贪⼼没有状态推 导,⽽是从局部直接选最优的。
对于动态规划问题,可以拆解为如下五步曲,这五步都搞清楚了,才能说把动态规划真的掌握了!
二、动态规划-五步曲
-
确定dp数组(dp table)以及下标的含义,dp[i]、dp[i][j]
-
确定递推公式
-
dp数组如何初始化
-
确定遍历顺序
-
举例推导dp数组
三、一些例子
1. (746)使用最小花费爬楼梯
leetcode746链接
题目描述
给你一个整数数组 cost ,其中 cost[i] 是从楼梯第 i 个台阶向上爬需要支付的费用。一旦你支付此费用,即可选择向上爬一个或者两个台阶。
你可以选择从下标为 0 或下标为 1 的台阶开始爬楼梯。
请你计算并返回达到楼梯顶部的最低花费。
代码如下:
class Solution(object):
def minCostClimbingStairs(self, cost):
"""
:type cost: List[int]
:rtype: int
"""
n = len(cost)
dp = [0]*(n+1) #dp数组的初始化
for i in range(2, n + 1):
dp[i] = min(dp[i - 1] + cost[i - 1], dp[i - 2] + cost[i - 2]) #确定递推公式
return dp[n]
2.(62)不同路径
leetcode62
一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为 “Start” )。
机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为 “Finish” )。
问总共有多少条不同的路径?
输入:m = 3, n = 7
输出:28
代码如下(示例):
class Solution(object):
def uniquePaths(self, m, n):
#dp[i][j]表示从(0,0)出发,到(i,j)有多少不同的路径
#因为只能向上或向下移动,所以递推公式为:dp[i][j] = dp[i-1][j]+dp[i][j-1]
#初始化,dp[i][0]=1,以及dp[0][j]=1,只能一个方向
dp = [[1]*n for i in range(m)]
for i in range(1,m):
for j in range(1,n):
dp[i][j] = dp[i-1][j] + dp[i][j-1]
return dp[m-1][n-1]
注意:
创建一个m*n的数组,dp = [ [1]*n for i in range(m)]
3.(63)不同路径II
leetcode63
一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为 “Start” )。
机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为 “Finish”)。
现在考虑网格中有障碍物。那么从左上角到右下角将会有多少条不同的路径?
网格中的障碍物和空位置分别用 1 和 0 来表示。
输入:obstacleGrid = [[0,0,0],[0,1,0],[0,0,0]]
输出:2
解释:3x3 网格的正中间有一个障碍物。
从左上角到右下角一共有 2 条不同的路径:
- 向右 -> 向右 -> 向下 -> 向下
- 向下 -> 向下 -> 向右 -> 向右
class Solution(object):
def uniquePathsWithObstacles(self, obstacleGrid):
"""
:type obstacleGrid: List[List[int]]
:rtype: int
"""
m = len(obstacleGrid) #行数
n = len(obstacleGrid[0]) #列数
dp = [[0]*n for i in range(m)]
if obstacleGrid[0][0] == 1:
return 0
#处理第一行
for i in range(n):
if obstacleGrid[0][i] == 0:
dp[0][i] = 1
else:break
#处理第一列
for i in range(m):
if obstacleGrid[i][0] == 0:
dp[i][0] = 1
else:break
for i in range(1,m):
for j in range(1,n):
if obstacleGrid[i][j] == 1:
dp[i][j] = 0
else:
dp[i][j] = dp[i-1][j] + dp[i][j-1]
return dp[m-1][n-1]
总结
例如:以上动态规划的基础问题,能力有限,只能写出简单粗暴的dp有更好的解法欢迎在评论区留下你的代码哈,类似的基础题还有斐波那契数(509),爬楼梯(70)等等,想更了解的话可以到leetcode上找找相应的题练练手,这里有时间的话就会更新哈。后续更新动态规划(二)-背包问题