算法学习笔记4
文章目录
一、DFS和回溯
1.1 DFS
1.1.1 BFS和DFS比较
先比较下BFS和DFS:
BFS在树的层次较深&子节点数较多的情况下,消耗内存十分严重。BFS适用于节点的子节点数量不多,并且树的层次不会太深的情况,寻找最优解(最短路径)。
DFS难以寻找最优解,仅仅只能寻找有解。其优点就是内存消耗小,克服了BFS的缺点。
1.1.2 DFS搜索过程
DFS举例:寻找V0到V6的一条路(无需最短路径)。
已知解为:V0->V3->V5->V6。
DFS函数的调用堆栈:
此后堆栈调用返回到V0那一层,因为V1那一层也找不到跟V1的相邻未访问节点
此后堆栈调用返回到V3那一层
此后堆栈调用返回到主函数调用DFS(V0,0)的地方,因为已经找到解,无需再从别的节点去搜别的路径了。
这个例子很好的展示了DFS搜索的过程,每进行一次搜索,都要在节点进行判断下一步的可选择方案,美中不足的是并没有体现出“深度”的意义。
1.1.3 DFS中深度作用
这个例子完美解释了“深度”的含义,参考Jack-Huang 。
输出自然数1到n所有不重复的排列,即n的全排列,要求所产生的任一数字序列中不允许出现重复的数字。
我们可以模拟出n个盒子和n张卡片,我们需要将n张卡片分别放到n个盒子里,且每个盒子只能放1张卡片,那有多少种方案呢?
下图为模拟放卡片的过程。
整个过程可以描述如下:
参考算法与编程之美
对于需要排列的元素用数组arr储存,temp用于保存结果。
由于选择一个数字后,后面不可再选,如temp第一个格子填1,后面三个格子便不能再填1,所以需要有visit记录哪些元素可以使用,True表示可以使用,Flase表示已经使用过,不能再使用。
visit = [True, True, True, True]
temp = ["" for x in range(0, 4)]
#position表示需要对temp哪个位置进行填充
def dfs(position):
# 递归出口,temp数组已填满
if position == len(arr):
print(temp)
return
# 递归主体
for index in range(0, len(arr)):
#当前元素可以使用,填入temp
if visit[index] == True:
temp[position] = arr[index]
#填入后将其状态改为不可使用
visit[index] = False
dfs(position + 1)
visit[index] = True # 回溯。非常重要
完整代码如下:
#include <stdio.h>
#include <iostream>
using namespace std;
int arr[101], temp[101], visit[101], n;
void print()
{
int i;
for (i = 0; i < n; i++) cout << temp[i] << ' ';
cout << endl;
}
inline void dfs(int i)//现在是第i层,也可以看成是第i个盒子,把数据放到这个盒子里
{
int j;
if (i == n)//如果到达了第n层说明已经搜索完成,输出
{
print();//输出方案
return;//返回上一层(上一个盒子)
}
for (j = 0; j < n; j++)//开始放数据
{
if (visit[j] == 0)//这个数可以放(未标记)
{
temp[i] = arr[j];//放这个数
visit[j] = 1;//标记被放过了
dfs(i + 1);//放第i+1个盒子(层)
visit[j] = 0;//返回之前一步,回溯
}
}
}
int main()
{
ios::sync_with_stdio(false);
cin >> n;
for (int i = 0; i < n; i++) arr[i] = i + 1;
dfs(0);//开始深搜
system("pause");
return 0;
}
这个例子中,box的数量就是需要搜索的深度,只有当每一个盒子里都有卡片,才可以结束搜索。
每进行一次搜索,都要在节点进行判断:上一个盒子已经放过卡片了,那么就不能再放入新的卡片,需要标记这个盒子的状态为不可用,当所有盒子都被标记为不可用,搜索也就完成了,也和深度(box的数量)对应。
这里DFS和回溯一起作用,下面再来看一下回溯。
1.2 回溯
这部分全部参考 labuladong。
1.2.1 回溯算法的框架
result = []
def backtrack(路径, 选择列表):
if 满足结束条件:
result.add(路径)
return
for 选择 in 选择列表:
#做选择
将该选择从选择列表移除
路径.add(选择)
backtrack(路径, 选择列表)
# 撤销选择
路径.remove(选择)
将该选择再加入选择列表
1.2.2 回溯-全排列问题
仍然采用1.1.3中的例子。绘制回溯算法的「决策树」:
在每个节点上其实都在做决策。比如说在下图的红色节点上,就在做决策,可以选择 1 那条树枝,也可以选择 3 那条树枝。为啥只能在 1 和 3 之中选择呢?因为 2 这个树枝在你身后,这个选择你之前做过了,而全排列是不允许重复使用数字的。[2] 就是「路径」,记录已经做过的选择;[1,3] 就是「选择列表」,表示当前可以做出的选择;「结束条件」就是遍历到树的底层,也可以理解为深度。
那么,全排列其实就是遍历回溯算法决策树的过程,其路径就是全排列。
多叉树遍历框架一般是这样的:
void traverse(TreeNode root) {
for (TreeNode child : root.childern)
// 前序遍历需要的操作
traverse(child);
// 后序遍历需要的操作
}
作者labuladong画的这些图太神了,让我对回溯算法恍然大悟。
所谓的前序遍历和后序遍历,他们只是两个很有用的时间点。前序遍历的代码在进入某一个节点之前的那个时间点执行,后序遍历代码在离开某个节点之后的那个时间点执行。
「路径」和「选择」是每个节点的属性,函数在树上游走要正确维护节点的属性,那么就要在这两个特殊时间点搞点动作:
完整代码如1.1.3所示,visit数组记录的就是可选的路径,temp记录已经选择路径。
全排列穷举整棵决策树是无法避免的,这也是回溯算法的一个特点,不像动态规划存在重叠子问题可以优化,回溯算法就是纯暴力穷举,复杂度一般都很高。
所以全排列问题不管怎么优化,都符合回溯框架,而且时间复杂度都不可能低于 O(N!)。
1.2.3 回溯-N皇后问题
一个 N×N 的棋盘,让你放置 N 个皇后,使得它们不能互相攻击。
PS:皇后可以攻击同一行、同一列、左上左下右上右下四个方向的任意单位。
套用框架的完整代码如下:
#include <stdio.h>
#include <iostream>
#include <vector>
#include <string>
#include <iomanip>
using namespace std;
vector<vector<string>> res;//放置解的结果
int n;
/* 是否可以在 board[row][col] 放置皇后?
因为同一行只放置一个Q,且行数依次增加,左下方和右下方还未放置数据
所以只需考虑列、左上方和右上方
*/
bool isValid(vector<string>& board, int row, int col) {
int n = board.size();
// 检查列是否有皇后互相冲突
for (int i = 0; i < n; i++) {
if (board[i][col] == 'Q')
return false;
}
// 检查右上方是否有皇后互相冲突
for (int i = row - 1, j = col + 1;
i >= 0 && j < n; i--, j++) {
if (board[i][j] == 'Q')
return false;
}
// 检查左上方是否有皇后互相冲突
for (int i = row - 1, j = col - 1;
i >= 0 && j >= 0; i--, j--) {
if (board[i][j] == 'Q')
return false;
}
return true;
}
// 路径:board 中小于 row 的那些行都已经成功放置了皇后
// 选择列表:第 row 行的所有列都是放置皇后的选择
// 结束条件:row 超过 board 的最后一行
void backtrack(vector<string>& board, int row) {
// 触发结束条件
if (row == board.size()) {
res.push_back(board);
for (int i = 0; i < n; i++)
{
for (int j = 0; j < n; j++) {
cout << setw(2) << board[i][j];
}
cout << endl;
}
cout << endl;
return;
}
int n = board[row].size();
for (int col = 0; col < n; col++) {
// 排除不合法选择
if (!isValid(board, row, col))
continue;
// 做选择
board[row][col] = 'Q';
// 进入下一行决策
backtrack(board, row + 1);
// 撤销选择
board[row][col] = '*';
}
}
/* 输入棋盘边长 n,返回所有合法的放置 */
vector<vector<string>> solveNQueens(int n) {
// '.' 表示空,'Q' 表示皇后,初始化空棋盘。
vector<string> board(n, string(n, '.'));//相当于构造了n×n的棋盘
backtrack(board, 0);
cout << res.size() << endl;//8皇后问题共有92个解
return res;
}
int main()
{
ios::sync_with_stdio(false);
cin >> n;
solveNQueens(n);//开始深搜
system("pause");
return 0;
}
运行结果如下(8皇后问题):
上述代码没有考虑棋盘的“对称关系”,“旋转关系”或者“转置关系”,有待后续进一步研究。
二、字符串的排列
2.1 题目描述
字符串中有可能有重复的字符。
2.2 思考
全排列问题,考虑DFS和回溯算法。
对DFS和回溯算法进行空间上的优化,不再开辟新的空间储存字符串,将字符串原地交换,因为需要遍历整个回溯算法决策树,所以时间复杂度不变。
时间复杂度:O(n!)
空间复杂度:O(1),原地交换
图片来自牛客网评论区,DFS深度为字符串长度,回溯前序遍历需要的操作和后后序遍历需要的操作均为swap。
不同的是字符串中可能有重复的数字,需要对决策树进行剪枝操作。
下图来自 hellosc01:
此处使用c++的set容器去重,同时达到按字母顺序排序。
2.3 代码实现
代码如下:
class Solution {
public:
vector<string> Permutation(string str) {
len = str.size();
if(len == 0) return{};
backtrack(str,0);
return vector<string>({ret.begin(), ret.end()});
}
void backtrack(string str,int box){
if(box == len-1) ret.insert(str);
else{
for(int i = box; i < len; i++){
swap(str[i],str[box]);
backtrack(str,box+1);
swap(str[i],str[box]);
}
}
}
private:
int len;
set<string> ret;
};
终于通过啦!