1.回溯算法理论基础
1.1什么是回溯法
- 回溯法也可以叫做回溯搜索法,它是一种搜索的方式。
- 回溯是递归的副产品,只要有递归就会有回溯。
- 回溯函数也就是递归函数,指的都是一个函数。
1.2回溯法的效率
回溯的本质是穷举(纯暴力搜索),穷举所有可能,然后选出我们想要的答案,如果想让回溯法高效一些,可以加一些剪枝的操作,但也改不了回溯法就是穷举的本质。
1.3回溯法解决的问题
回溯法,一般可以解决如下几种问题:
- 组合问题:N个数里面按一定规则找出k个数的集合
- 切割问题:一个字符串按一定规则有几种切割方式
- 子集问题:一个N个数的集合里有多少符合条件的子集
- 排列问题:N个数按一定规则全排列,有几种排列方式
- 棋盘问题:N皇后,解数独等等
注意:组合是不强调元素顺序的,排列是强调元素顺序。
例如:{1, 2} 和 {2, 1} 在组合上,就是一个集合,因为不强调顺序,而要是排列的话,{1, 2} 和 {2, 1} 就是两个集合了。
记住组合无序,排列有序,就可以了。
1.4如何理解回溯法
- 回溯法解决的问题都可以抽象为树形结构,
- 因为回溯法解决的都是在集合中递归查找子集,集合的大小就构成了树的宽度,递归的深度就构成了树的深度。
- 递归就要有终止条件,所以必然是一棵高度有限的树(N叉树)。
1.5回溯法的模板
1. 回溯函数模板返回值以及参数
- 函数起名字一般为backtracking
- 回溯算法中函数返回值一般为void
- 回溯算法需要的参数不容易一次性确定下来,所以一般是先写逻辑,然后需要什么参数,就填什么参数。
void backtracking(参数)
2. 回溯函数终止条件
- 遍历树形结构一定要有终止条件,而回溯算法可以抽象为树形结构,所以回溯也有要终止条件;
- 什么时候达到了终止条件?
- 树中就可以看出,一般来说搜到叶子节点了,也就找到了满足条件的一条答案,把这个答案存放起来,并结束本层递归。
if (终止条件) {
存放结果;
return;
}
3. 回溯搜索的遍历过程
回溯法一般是在集合中递归搜索,集合的大小构成了树的宽度,递归的深度构成的树的深度。
回溯函数遍历过程伪代码如下:
for (选择:本层集合中元素(树中节点孩子的数量就是集合的大小)) {
处理节点;
backtracking(路径,选择列表); // 递归
回溯,撤销处理结果
}
for循环就是遍历集合区间,可以理解一个节点有多少个孩子,这个for循环就执行多少次。
backtracking这里自己调用自己,实现递归。
从图中可以看出,for循环可以理解是横向遍历,backtracking(递归)就是纵向遍历,这样就把这棵树全遍历完了,一般来说,搜索叶子节点就是找的其中一个结果了。
4.回溯算法模板框架如下:
void backtracking(参数) {
if (终止条件) {
存放结果;
return;
}
for (选择:本层集合中元素(树中节点孩子的数量就是集合的大小)) {
处理节点;
backtracking(路径,选择列表); // 递归
回溯,撤销处理结果
}
}
2. 77. 组合
给定两个整数 n 和 k,返回范围 [1, n] 中所有可能的 k 个数的组合。
你可以按 任何顺序 返回答案。
题目链接/文章讲解:https://programmercarl.com/0077.%E7%BB%84%E5%90%88.html
视频讲解:https://www.bilibili.com/video/BV1ti4y1L7cv
剪枝操作:https://www.bilibili.com/video/BV1wi4y157er
1. 递归函数的返回值以及参数
- 函数里一定有两个参数,既然是集合n里面取k个数,那么n和k是两个int型的参数。
- 然后还需要一个参数,为int型变量startIndex,这个参数用来记录本层递归的中,集合从哪里开始遍历(集合就是[1,…,n] )。
- 为什么要有这个startIndex呢?
- startIndex 就是为了防止出现重复的组合
- 在集合[1,2,3,4]取1之后,下一层递归,就要在[2,3,4]中取数了,那么下一层递归如何知道从[2,3,4]中取数呢,靠的就是startIndex
- 所以需要startIndex来记录下一层递归,搜索的起始位置。
2. 回溯函数终止条件
- path这个数组的大小如果达到k,说明我们找到了一个子集大小为k的组合了,在图中path存的就是根节点到叶子节点的路径。
- 此时用result二维数组,把path保存起来,并终止本层递归。
3. 单层搜索的过程
- 回溯法的搜索过程就是一个树型结构的遍历过程,在如下图中,可以看出for循环用来横向遍历,递归的过程是纵向遍历。
- for循环每次从startIndex开始遍历,然后用path保存取到的节点i。
- 递归函数通过不断调用自己一直往深处遍历,总会遇到叶子节点,遇到了叶子节点就要返回。
- 递归函数的下面部分就是回溯的操作了,撤销本次处理的结果。
代码:
path = [] # 记录每一个组合的结果(即每一个叶子)
res =[] # 收集最终结果
def back(n, k, startindex):
if len(path)==k:
res.append(path[:]) # 使用path[:]进行复制,否则后边res里append的path会跟着改变
return
for i in range(startindex,(n+1)-(k-len(path))+1):
path.append(i)
back(n, k, i+1 )
path.pop() # 回溯
n = 4
k = 2
back(n, k, 1)
print(res)
剪枝:
如何进行剪枝优化?
举一个例子,n = 4,k = 4的话,那么第一层for循环的时候,从元素2开始的遍历都没有意义了。 在第二层for循环,从元素3开始的遍历都没有意义了。
图中每一个节点(图中为矩形),就代表本层的一个for循环,那么每一层的for循环从第二个数开始遍历的话,都没有意义,都是无效遍历。
所以,可以剪枝的地方就在递归中每一层的for循环所选择的起始位置。
如果for循环选择的起始位置之后的元素个数 已经不足 我们需要的元素个数了,那么就没有必要搜索了。
注意代码中i,就是for循环里选择的起始位置。
优化:
- 已经选择的元素个数:len(path);
- 还需要的元素个数为: k - len(path);
- 剪枝的部分就是:从索引x之后,剩余的数组长度取不到k-len(path)个数
- 索引x的值,取决于取这个值以后的数组长度(n-x+1)等于剩余没取的数的数量
- n-x+1=k-len(path),x = (n+1)-(k-len(path)),索引x也就是遍历的最大范围
- 因为x还是可以取的,range函数时左闭右开,所以最终范围还要再加1,即(n+1)-(k-len(path))+1
注意:
将组合结果path添加到res中时,需要使用path[:]复制,否则后边res里append的path会跟着改变