如何理解“回溯算法”?
电影《蝴蝶效应》中,主人公为了达到自己的目标,一直通过回溯的方法,回到童年,在关键的岔路口,重新做选择。这里就运用了回溯算法。
笼统的讲,回溯算法很多时候都应用在“搜索”这类问题上,不过这里说的搜索,并不是狭义的指图的搜索算法,而是在一组可能的解中,搜索满足期望的解。
回溯的处理思想,有点类似枚举搜索。我们枚举所有的解,找到满足期望的解。为了有规律枚举所有可能的解,避免遗落和重复,我们把问题求解的过程分为多个阶段。每个阶段,我们都会面对一个岔路口,我们先随意选一条路走,当发现这条路走不通的时候(不符合期望的解),就回退到上一个岔路口,另选一种走法继续走。
应用
八皇后
比较经典的例子是八皇后问题。我们有一个 8x8 的棋盘,希望往里放 8 个棋子(皇后),每个棋子所在的行、列、对角线都不能有另一个棋子。八皇后问题就是期望找到所有满足这种要求的放棋子方式。
我们把这个问题划分成8个阶段,依次将8个棋子放到第一行、第二行、第三行…第八行。在放置的过程中,我们不停的检查当前的方法,是否满足要求。如果满足,就跳到下一行继续放置棋子;如果不满足,就换一种方法,继续尝试。如下:
int[] result = new int[8]; //下标表示行,值标签queue存储在哪一列
public void cal8queue(int row){
if(row == 8){ // // 8 个棋子都放置好了,打印结果
printQueue(result);
return;
}
for (int column = 0; column < 8;column++) { //每一行中都有8种放发
if(isOk(row, column)){
result[row] = column; // 第 row 行的棋子放到了 column 列
cal8queue(row + 1); // 考察下一行
}
}
}
private boolean isOk(int row, int column){ // 判断row行column列放置是否合适
int leftup = column - 1, rightup = column + 1;
for (int i = row - 1; i >= 0 ; --i) { // 逐行往上考察每一行
if(result[i] == column){ // 第i行的column列有棋子吗
return false;
}
if(leftup >= 0){ // 考察左上角线:第i行leftup列有棋子吗?
if (result[i] == leftup) return false;
}
if (rightup < 8) { // 考察右上对角线:第 i 行 rightup 列有棋子吗?
if (result[i] == rightup) return false;
}
--leftup;
++rightup;
}
return true;
}
private void printQueue(int [] result){ // 打印出一个二维矩阵
for (int row = 0; row < 8; row++) {
for (int column = 0; column < 8; column++) {
if(result[row] == column){ // 放置了棋子
System.out.print("Q ");
}else{
System.out.print("* ");
}
}
}
}
0-1背包
0-1背包是经典的算法问题,很多场景都可以抽象成这个问题模型。这个问题的经典解法是动态规划。不过还有一种简单但是没有那么高效的解法,就是回溯算法。
问题
我们现在有一个背包,背包总承载重量是Wkg,现在我们有n个物品,每个物品的重量不等,并且不可分割。我们现在期望选择几件物品,装载到背包中,在不超过背包所能装载重量的前提下,如何让背包中物品的总重量最大。
ps:可以装某一个物品的一部分到背包里面的可以用贪心算法解决;而物品不可分割的,要么装要么不装(所以叫做0-1背包问题),这样的问题就无法用贪心算法来解决,可以用回溯算法解决。
分析
对于每个物品来说,都有两个选择,装进背包或者不装进背包。对于n个物品来说,总的装法就有 2 n 2^n 2n种,去掉总重量超过Wkg的,从剩下的装法中选择总重量最接近Wkg的。不过,我们如何才能不重复的穷举出这 2 n 2^n 2n种装法呢?
这里就可以用回溯的方法。我们可以把物品依次排列,整个问题就分解为了n个阶段,每个阶段对应一个物品怎么选择。先对第一个物品进行选择,选择装进去或者不装进去,然后在递归的处理剩下的物品。代码如下:
public int maxW = Integer.MIN_VALUE; //存储背包中物品总重量的最大值
/*
* @param cw表示当前已经装进去的总理和
* @param i表示考察到哪个物品了
* @param items 待装的物品
* @param totalCount 物品个数(items的长度)
* @param totalWeight 背包可承受重量
* 假设背包中可以承受重量100,物品个数10,可以这样调用函数:
* f(0, 0, a, 10, 100);
* */
public void f(int i, int currWeight, int[] items, int totalCount, int totalWeight){
if(currWeight == totalWeight || i == totalCount){ // cw == w表示装满了;i == n表示已经考察完有的物品
if(currWeight > maxW){
maxW = currWeight; // 更新【存储背包中物品总重量的最大值】
}
return;
}
f(i + 1, currWeight, items, totalCount, totalWeight); //当前物品不装进背包
// 如果当前还未超过最大值,则继续循环
if(currWeight + items[i] <= totalWeight){
f(i+1,items[i] + currWeight , items, totalCount, totalWeight); //当前物品装到背包里面
} // 已经超过可以背包承受的重量的时候,就不要再装了
}
这里还稍微用到了一点搜索减枝的技巧,就是当发现已经选择的物品的重量超过Wkg之后,我们就停止继续探测剩下的物品。
正则表达式匹配
问题
正在表达式中,最重要的通配符就是回溯,通配符结合在一起,可以表达非常丰富的语义。这里假设正在表达式中只包含了*
和?
这两种通配符,并且对这两个通配符的语义稍微做些改变,其中,“*”匹配任意多个(大于等于0个)任意字符,?
匹配零个或者一个任意字符。那如何用回溯算法,判断一个给定的文本,能否跟给定的正则表达式匹配呢?
分析
我们依次考察正则表达式中的每个字符,当是非通配符时,我们就直接跟文本的字符就那些匹配,如果相同,则继续往下处理;如果不同,则回溯。
如果遇到特殊字符的时候,我们就有很多种处理方式了,也就是所谓的“岔路口”,比如“*”有多种匹配方案,可以匹配任意个文本串中的字符,我们就先随意的选择一种匹配方案,然后继续考察剩下的字符。如果中途发现无法继续匹配下去了,我们就回到这个岔路口,重新选择一种匹配方案,然后再继续匹配剩下的字符。
代码实现
public class Pattern {
private boolean matched = false;
private char[] pattern; //正则表达式
private int plen; //正则表达式长度
public Pattern(char [] pattern, int plen){
this.pattern = pattern;
this.plen = plen;
}
public boolean match(char[] text, int tlen) { // 文本串及长度
matched = false;
rmatch(0, 0, text, tlen);
return matched;
}
private void rmatch(int ti, int pj, char []text, int tlen){
if(matched){ //如果已经匹配了,就不用在继续递归了
return;
}
if(pj == plen){ // 正则表达式到结尾了
if(ti == tlen){
matched = true; //文本串也到结尾了
}
return;
}
// *匹配任意个字符
if(pattern[pj] == '*'){
for (int k = 0; k < tlen - ti; k++) { // tlen为文本串的长度, ti为
rmatch(ti + k, pj + 1, text, tlen);
}
}else if (pattern[pj] == '?') { // ? 匹配 0 个或者 1 个字符
rmatch(ti, pj+1, text, tlen);
rmatch(ti+1, pj+1, text, tlen);
} else if (ti < tlen && pattern[pj] == text[ti]) { // 纯字符匹配才行
rmatch(ti+1, pj+1, text, tlen);
}
}
}
小结
回溯算法的思想非常简单,大部分情况下,都是用来解决广义的搜索问题,也就是,从一组可能的解中,选择处一个满足要求的解。回溯算法非常适合用递归来实现,在实现的过程中,剪枝操作是提高回溯效率的一种技巧。利用剪枝,我们并不需要穷举搜索所有的情况,从而提高搜索效率。
尽管回溯算法的原理非常简单,但是可以解决很多问题,比如深度优先搜索、八皇后、0-1背包问题、图的着色、旅行商问题、数独、全排列、正在表达式匹配等等。
DFS和回溯的区别:
- DFS 是一个劲的往某一个方向搜索,而回溯算法建立在 DFS 基础之上的,但不同的是在搜索过程中,达到结束条件后,恢复状态,回溯上一层,再次搜索。
- 因此回溯算法与 DFS 的区别就是有无状态重置
何时使用回溯算法
- 当问题需要 “回头”,以此来查找出所有的解的时候,使用回溯算法。
- 即满足结束条件或者发现不是正确路径的时候(走不通),要撤销选择,回退到上一个状态,继续尝试,直到找出所有解为止