前言
本篇文章旨在用通俗简单的语言来教你入门动态规划。动态规划是算法中很重要的一块内容,在各大公司的笔试算法中占据大壁江山,所以,掌握动态规划是你拿到称心的offer的前提,废话不多说,让我们来开始一段算法之旅吧。在开始之前,你要努力忘掉你理解的动态规划,因为有可能那些都是错误的,会限制你的思路。相信我,读完这篇文章你肯定会有收获。
前导技能
- 递归 (熟悉递归运行原理)
- 暴力搜索
- 在线的智商
问题引入
在开始后续的工作之前,我们先来看一道非常简单的题目
题目
题目来源Leetcode
You are a professional robber planning to rob houses along a street. Each house has a certain amount of money stashed, the only constraint stopping you from robbing each of them is that adjacent houses have security system connected and it will automatically contact the police if two adjacent houses were broken into on the same night.
Given a list of non-negative integers representing the amount of money of each house, determine the maximum amount of money you can rob tonight without alerting the police.
译文:
你是一个职业强盗,打算在街上抢劫房屋。每家每户都有一定数量的现金,唯一的限制就是阻止你去抢劫,因为相邻的房子都有安全系统,如果两个相邻的房子在同一个晚上被闯入,它会自动联系警察。
跟着下面的步骤,仔细思考,在这之前,忘掉你对动态规划的理解!
暴搜,动态规划的前生
我假设你具备了我说的那些前导技能,相信你是一个暴搜出奇迹的天才。
那么,我们现在用暴力搜索来分析一下这道题目
现在,我们从最后一个商家开始,搜索我们想要的答案
那么我们现在应该有这样一个函数,假设它具备暴力搜索的功能。那么,我们首先返回已经”完成”的暴力搜索到的答案
java版
1
2
3
4
5
6
7
|
private int search(int i, int[] nums) {
...
}
public int rob(int[] nums) {
return search(nums.length -
1, nums);
}
|
python版
1
2
3
4
5
|
def search(self, i, nums):
pass
def rob(self, nums):
return self.search(len(nums) -
1, nums)
|
现在,我们”基本”上已经完成了这道题目,因为暴搜对你来说很简单。其实上面这些文字,我只是在教你如何思考题目。接下来,让我们来完成暴搜的主体部分吧!
依据题意,我们不能盗窃相邻的商家,那么问题很简单了。搜索的状态只有两种,我们盗窃当前商家,然后跳过前面一个,继续判断前面的前面那家商家,或者我们不盗窃当前商家,往前走,因为前面有好家伙!这样,我们应该很容易完成search
里面的内容
java版
1
2
3
4
5
6
|
private int search(int i, int[] nums) {
if (i <
0) {
// 没有商家了,我们要开始销赃
return
0;
}
return Math.max(search(i -
1, nums), nums[i] + search(i -
2, nums));
}
|
python版
1
2
3
4
|
def search(self, i, nums):
if i <
0:
# 没有商家了,我们要开始销赃
return
0
return max(self.search(i -
1, nums), nums[i] + self.search(i -
2, nums))
|
记忆化搜索, 动态规划的今生
现在,我们已经得到了”正确”的答案。我们先来分析一下暴力搜索的时间复杂度吧
显然,这道题目,我们每个商家两个状态我们都模拟过了,那么很简单,时间复杂度就是O(2^n)
天啦噜,指数级的时间复杂度,你说你能走多远!
随便提一句,暴力搜索这类时间复杂度都和状态有关!
既然,这种暴搜我们”走不远”,那么怎么我们可以走得”更远呢”?
在此之前,我们先来直观得模拟一下我们暴搜的过程吧
1
2
3
4
5
6
7
8
|
# 现在我们用s(i)来表示我们上面的search方法
f(5) = max(f(4), nums[5] + f(3))
f(4) = max(f(3), nums[4] + f(2))
f(3) = max(f(2), nums[3] + f(1))
f(2) = max(f(1), nums[2] + f(0))
f(1) = max(f(0), nums[1] + f(-1) <=> nums[1]))
|
上面这个过程你看到了什么?
相信你肯定看出了我们重复计算了很多f()
函数,因为你的智商在线!
是的,我们重复计算了前面我们计算过的数据,下面,我们根据这一点来优化一下刚才的暴力搜索
java版
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
class Solution {
public int rob(int[] nums) {
int[] memo =
new
int[nums.length];
for (
int i =
0; i < nums.length; i++) {
memo[i] = -
1;
}
return search(nums.length -
1, nums, memo);
}
private int search(int i, int[] nums, int[] memo) {
if (i <
0) {
return
0;
}
if (memo[i] != -
1) {
return memo[i];
}
return memo[i] = Math.max(search(i -
1, nums, memo), nums[i] + search(i -
2, nums, memo));
}
}
|
python版
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
class Solution:
def rob(self, nums):
"""
:type nums: List[int]
:rtype: int
"""
return self.search(len(nums) -
1, nums, [
-1
for i
in range(len(nums))])
def search(self, i, nums, memo):
if i <
0:
return
0
if memo[i] !=
-1:
return memo[i]
memo[i] = max(self.search(i -
1, nums, memo), nums[i] + self.search(i -
2, nums, memo))
return memo[i]
|
上面,我们用一个
memo
数组来把我们计算过的数据保存一下,然后下一次用到时候直接返回即可!
这种方式的搜索,我们就叫它记忆化搜索!是不是很形象,记忆!
那么现在时间复杂度是多少呢?很明显是O(N)
现在我可以告诉你了,现在这种解法其实就是动态规划!你也许会说什么?你不是在逗我?但是我真的不是在逗你!
记忆化搜索就是递归版的动态规划,既然有递归版的,那么就有递推版的,我们仿照这个递归版的来写一下递推版的记忆化搜索!
java版
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
class Solution {
public int rob(int[] nums) {
int[] memo =
new
int[nums.length];
for (
int i =
0; i < nums.length; i++) {
memo[i] = -
1;
}
return searchBottom2Top(
0, nums, memo);
}
private int searchBottom2Top(int i, int[] nums, int[] memo) {
if (i >= nums.length) {
return
0;
}
if (memo[i] != -
1) {
// 其实这个地方不可能是-1,因为我们是递推
return memo[i];
}
return memo[i] = Math.max(searchBottom2Top(i +
1, nums, memo), nums[i] + searchBottom2Top(i +
2, nums, memo));
}
}
|
python版
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
class Solution:
def rob(self, nums):
"""
:type nums: List[int]
:rtype: int
"""
return self.searchBottom2Top(
0, nums, [
-1
for i
in range(len(nums))])
def searchBottom2Top(self, i, nums, memo):
if i >= len(nums):
return
0
if memo[i] !=
-1:
# 其实这个地方不可能是-1,因为我们是递推
return memo[i]
memo[i] = max(self.searchBottom2Top(i +
1, nums, memo), nums[i] + self.searchBottom2Top(i +
2, nums, memo))
return memo[i]
|
我想你在想,这和你之前见到的动态规划的写法还是不一致!
java版
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
class Solution {
public int rob(int[] nums) {
if (nums.length ==
0) {
return
0;
}
int[] dp =
new
int[nums.length];
dp[
0] = nums[
0];
if (nums.length ==
1) {
return dp[
0];
}
dp[
1] = Math.max(nums[
0], nums[
1]);
for (
int i =
2; i < nums.length; i++) {
dp[i] = Math.max(dp[i -
1], dp[i -
2] + nums[i]);
}
return dp[nums.length -
1];
}
}
|
python版
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
class Solution:
def rob(self, nums):
"""
:type nums: List[int]
:rtype: int
"""
if len(nums) ==
0:
return
0
dp = [
0
for i
in range(len(nums))]
dp[
0] = nums[
0]
if len(nums) ==
1:
return dp[
0]
dp[
1] = max(nums[
0], nums[
1])
for i
in range(
2, len(nums)):
dp[i] = max(dp[i -
1], nums[i] + dp[i -
2])
return dp[
-1]
|
现在是不是很眼熟了,这就是动态规划,其实前面的也是,只是方式不同罢了!看到这里是不是思路很清晰了,动态规划并不难,难的是我们分析问题的出发点。看这道题目,我们从递归一步一步到动态规划!
其实递归的本质就是n -> n - 1 -> n
到这里,我们真正知道了什么是动态规划,还有两个概念,我想你应该知道
最优子结构
- 子问题最优决策可导出原问题最优决策
- 无后效性
重叠子问题
- 去冗余
- 空间换时间(注意分析时空复杂度)
结尾
一道题看清动态规划的前世今生,打算用三篇文章来通俗的解释dp的概念以及思考方式!如果你喜欢这篇文章,欢迎关注我GitHub
转自:https://blog.stormma.me/2017/11/11/%E4%B8%80%E9%81%93%E9%A2%98%E7%9C%8B%E6%B8%85%E5%8A%A8%E6%80%81%E8%A7%84%E5%88%92%E7%9A%84%E5%89%8D%E4%B8%96%E4%BB%8A%E7%94%9F-%E4%B8%80/