1. 什么是回溯算法
在CH37贪心算法一节讲到贪心算法的本质:“问题求解分K个步骤,每一步都选择当前最优的选择,最终得到一个方案”。但是这个方案并不一定是最优解,那怎么才能得到全局最优解呢?这就需要回溯算法来帮忙。
回溯算法的思想类似深度优先搜索,K个阶段对应K个岔路口,选择一个方向一直走,如果不符合期望则返回上一个岔路口(回溯的表现)重新选择一个方向。直到得到一个可行解或者遍历完成得到全局最优解。
2. 回溯算法解决什么问题
回溯算法本质上就是枚举所有可能的路径,然后求取可行解或者最优解。
- 当求解可行解的时候,并不需要枚举所有路径,而是得到可行解即可终止算法。
- 当求全局最优的时候,需要遍历所有路径,对比求得全局最优解。
在搜索过程中,有一种优化方式:如果条件不满足则不继续搜索,采取剪枝策略优化算法。
所以回溯算法适合解决“能够分为K个步骤,搜索期望解路径的广义搜索问题”。
3. 回溯算法应用实例
3.1 8皇后问题
一个 8x8 的棋盘,希望放 8 个棋子(皇后),每个棋子所在的行、列、对角线都不能有另一个棋子。
解答:
这个问题是求解可行解的问题。
- 问题分为8个阶段。
- 每个阶段,遍历搜索路径;不满足条件,回溯上一步重新遍历另一条路径。
- 找到可行路径,则终止搜索,打印结果。
代码实现如下:
int[] result = new int[8];//全局或成员变量,下标表示行,值表示queen存储在哪一列
public void cal8queens(int row) { // 调用方式:cal8queens(0);
if (row == 8) { // 8个棋子都放置好了,打印结果
printQueens(result);
return; // 8行棋子都放好了,已经没法再往下递归了,所以就return
}
for (int column = 0; column < 8; ++column) { // 每一行都有8中放法
if (isOk(row, column)) { // 有些放法不满足要求
result[row] = column; // 第row行的棋子放到了column列
cal8queens(row+1); // 考察下一行
}
}
}
private boolean isOk(int row, int column) {//判断row行column列放置是否合适
int leftup = column - 1, rightup = column + 1;
for (int i = row-1; i >= 0; --i) { // 逐行往上考察每一行
if (result[i] == column) return false; // 第i行的column列有棋子吗?
if (leftup >= 0) { // 考察左上对角线:第i行leftup列有棋子吗?
if (result[i] == leftup) return false;
}
if (rightup < 8) { // 考察右上对角线:第i行rightup列有棋子吗?
if (result[i] == rightup) return false;
}
--leftup; ++rightup;
}
return true;
}
private void printQueens(int[] result) { // 打印出一个二维矩阵
for (int row = 0; row < 8; ++row) {
for (int column = 0; column < 8; ++column) {
if (result[row] == column) System.out.print("Q ");
else System.out.print("* ");
}
System.out.println();
}
System.out.println();
}
3.2 0-1背包问题
有一个背包总的容量是 W kg,有 n 个物品,重量不等并且不可分割。现在期望选几件物品装入背包,在不超过背包容量的前提下,如何让所装物品的总重量最大?
解答:
这个问题看起来很熟悉,期望值+限制值,看起来能用贪心算法解决呀,但是由于物品不可分割,贪心算法求解的方案并不一定是最优解,所以只能够借助回溯算法,来枚举所有可能方案,求得全局最优。
- n个物品,则分为n各阶段。
- 每个阶段,第 i 个物品装还是不装。
- 在 i 物品装还是不装的情况下,继续考察第 i+1 个物品。
- 遍历所有情况,判断并更新全局最优解maxW。
- maxW即为全局最优解。
代码实现如下:
public int maxW = Integer.MIN_VALUE; //存储背包中物品总重量的最大值
// cw表示当前已经装进去的物品的重量和;i表示考察到哪个物品了;
// w背包重量;items表示每个物品的重量;n表示物品个数
// 假设背包可承受重量100,物品个数10,物品重量存储在数组a中,那可以这样调用函数:
// f(0, 0, a, 10, 100)
public void f(int i, int cw, int[] items, int n, int w) {
if (cw == w || i == n) { // cw==w表示装满了;i==n表示已经考察完所有的物品
if (cw > maxW) maxW = cw;
return;
}
f(i+1, cw, items, n, w);
if (cw + items[i] <= w) {// 已经超过可以背包承受的重量的时候,就不要再装了
f(i+1,cw + items[i], items, n, w);
}
}
代码中,通过判断物品重量是否超过背包重量,有一个剪枝的操作。
3.3 正则表达式问题
假设正则表达式中只包含 * 和 ?两种通配符,其中 * 匹配任意多个(大于等于 0 个)字符,? 匹配0个或者一个任意字符。基于以上假设,如何用回溯算法,判断一个给定的文本,能否跟正则表达式匹配?
解答:
这个问题本质上是找可行解的问题,当matched为true则停止搜索。
- 逐个字符扫描正则表达式,为K步骤。
- 每一步,分三种情况,* 或者 ? 或者 普通字符。
- * 表示 0 或者多个字符的情况,? 表示0或者1个字符,普通字符则直接判断匹配进入下一步,不匹配直接返回(剪枝操作)。
- 当matched为true时候,说明已经匹配上了则停止搜索。
- 当模式串和字符串都已经到了结尾,说明已经匹配成功了置matched为true,否则直接返回。
代码实现如下:
public class Pattern {
private boolean matched = false;
private char[] pattern; // 正则表达式
private int plen; // 正则表达式长度
public Pattern(char[] pattern, int plen) {
this.pattern = pattern;
this.plen = plen;
}
public boolean match(char[] text, int tlen) { // 文本串及长度
matched = false;
rmatch(0, 0, text, tlen);
return matched;
}
private void rmatch(int ti, int pj, char[] text, int tlen) {
if (matched) return; // 如果已经匹配了,就不要继续递归了
if (pj == plen) { // 正则表达式到结尾了
if (ti == tlen) matched = true; // 文本串也到结尾了
return;
}
if (pattern[pj] == '*') { // *匹配任意个字符
for (int k = 0; k <= tlen-ti; ++k) {
rmatch(ti+k, pj+1, text, tlen);
}
} else if (pattern[pj] == '?') { // ?匹配0个或者1个字符
rmatch(ti, pj+1, text, tlen);
rmatch(ti+1, pj+1, text, tlen);
} else if (ti < tlen && pattern[pj] == text[ti]) { // 纯字符匹配才行
rmatch(ti+1, pj+1, text, tlen);
}
}
}