算法设计与分析笔记

木建隶

已于 2024-06-21 21:10:45 修改

阅读量549

点赞数 3

分类专栏：算法文章标签：算法笔记

于 2024-06-20 17:31:34 首次发布

本文链接：https://blog.csdn.net/endangered_ds/article/details/139838830

版权

算法专栏收录该内容

4 篇文章 0 订阅

订阅专栏

截图摘自湖南大学彭鹏老师的ppt。笔记也是根据他的ppt整理的。

动态规划

核心

用数组记录中间结果，避免重复计算

三角数塔问题

问题描述

给定一个三角形数塔，从顶部出发，每次只能移动到下一行的相邻元素。要求找到一条路径，使得路径上的数字和最大。

假设有一个三角形数塔，如下所示：

dp数组 dp[i][j]表示以matrix[i][j]为结尾的，最大路径的和

    3
   10 7
  12 14 13
 20 19 23 16

最后结果是23

解题思路

dp[i][j]=max(dp[i-1][j],dp[i-1][j+1])+matrix[i][j];

伪代码


int max_value(vector<vector<int>> &matrix ){
    vector<vector<int>> dp(matrix.size(),vector<int>(matrix.size()));
    dp[0][0] = matrix[0][0];
    for(int i=1;i<matrix.size();i++){
        dp[i][0] = dp[i-1][0] + matrix[i][0]; // 最左边的
        for(int j=1;j<i;j++){
            // 中间的
            dp[i][j] = max(dp[i-1][j-1],dp[i-1][j]) + matrix[i][j];
        }
        // 最右边的
        dp[i][i] = dp[i-1][i-1] + matrix[i][i];
    }
    return max(dp.back().begin(),dp.back().end());    
};

复杂度分析

时间复杂度：O(n^2)，其中 n 是三角形的行数。
空间复杂度：O(n^2)，其中 n 是三角形的行数。

最大字段和

问题描述

给定由n个整数（可能有负整数）组成的序列(a1, a2, …, an)，最大子段和问题要求该序列形如的最大值（1≤i≤j≤n），当序列中所有整数均为负整数时，其最大子段和为0。

示例

例如，序列(-20,11,-4,13, -5, -2)的最大子段和为 a2+a3+a4=20 。

dp[i]表示以a[i]开头的，从a[i]–>a.back()的最大子段和

dp数组

dp[i] = max(dp[i+1]+a[i],a[i]);

	1	2	3	4	5	6
a	-20	11	-4	13	-5	-2
dp	0	20	9	13	-5	-2

所以最后答案是20

// 注意是后序
int max_sub_array(vector<int> &a){
    int n = a.size();
    vector<int> dp(n);
    dp.back() = a.back();
    int max_sum = a[0];
    for(int i=n-2;i>=0;i--){
        dp[i] = max(dp[i+1]+a[i],a[i]);
        max_sum = max(max_sum,dp[i]);
    }
    return max_sum;
}

复杂度分析

时间复杂度：O(n)，其中 n 是序列的长度。
空间复杂度：O(n)，其中 n 是序列的长度。

最长公共子序列

问题描述

给定两个字符串str1和str2，返回两个字符串的最长公共子序列（LCS）。

子序列是指从原字符串中删除若干个字符后，不改变剩余字符顺序得到的字符串。最长公共子序列是两个字符串所共同拥有的最长子序列。

例如，对于字符串"abcde"和"ace"，最长公共子序列是"ace"，因此长度为3。

示例

abcbdab
bdcaba

dp[i][j]表示str1[0:i]和str2[0:j]的最长公共子序列长度

	a	b	c	b	d	a	b
start	0	0	0	0	0	0	0
b	0	1	1	1	1	1	1
d	0	1	1	1	2	2	2
c	0	1	2	2	2	2	2
a	1	1	2	2	2	3	3
b	1	2	2	3	3	3	4
a	1	2	2	3	3	4	4

所以最后答案是4 bdab

代码

int longest_common_subsequence(string &str1,string &str2){
    int n = str1.size();
    int m = str2.size();
    vector<vector<int>> dp(n+1,vector<int>(m+1,0));
    for(int i=1;i<=n;i++){
        for(int j=1;j<=m;j++){
            if(str1[i-1] == str2[j-1]){
                dp[i][j] = dp[i-1][j-1]+1;
            }else{
                dp[i][j] = max(dp[i-1][j],dp[i][j-1]);
            }
        }
    }
    return dp[n][m];
}

复杂度分析

时间复杂度：O(nm)，其中 n 和 m 分别是字符串 str1 和 str2 的长度。
空间复杂度：O(nm)，其中 n 和 m 分别是字符串 str1 和 str2 的长度。

01背包问题

问题描述

给定 n 种物品和一个容量为 w 的背包，每种物品都只有一件可用。第 i 种物品的体积是 vi，价值是 wi。求解将哪些物品装入背包，可使这些物品的总体积不超过背包容量，且总价值最大。输出最大价值。

示例

number=4 capacity=8

i	1	2	3	4
s (weight)	2	3	4	5
v (value)	3	4	5	6

dp数组

dp[i][j]表示，在总容量为j的情况下，在0~i个物品中，能获得的最大价值。

dp[i][j]=max(dp[i-1][j],dp[i-1][j-s[i]]+v[i])

	2	3	4	5	6	7	8
1	3	3	3	3	3	3	3
2	3	4	4	7	7	7	7
3	3	4	4	7	8	9	9
4	3	4	4	7	8	9	10

代码

int max_value_in_knapsack(vector<int> &s,vector<int> &v,int capacity){
    int n = s.size();
    vector<vector<int>> dp(n+1,vector<int>(capacity+1,0));
    for(int i=1;i<=n;i++){
        for(int j=1;j<=capacity;j++){
            if(j>=s[i-1]){
                dp[i][j] = max(dp[i-1][j],dp[i-1][j-s[i-1]]+v[i-1]);
            }else{
                dp[i][j] = dp[i-1][j];
            }
        }
    }
    return dp[n][capacity];
}

复杂度分析

时间复杂度：O(nm)，其中 n 和 m 分别是物品的数量和背包容积。
空间复杂度：O(nm)，其中 n 和 m 分别是物品的数量和背包容积。

贪心算法

选取局部最优解

优缺点

优点：速度快，复杂度低
缺点：需要证明是最优解

活动选择问题

问题描述

假设我们存在这样一个活动集合S={a1,a2,a3,a4,…,an},其中每一个活动ai都有一个开始时间si和结束时间fi保证(0≤si<fi),活动ai进行时，那么它占用的时间为[si,fi)，现在这些活动占用一个共同的资源(教室)，就是这些活动会在某一时间段里面进行安排，如果两个活动ai和aj的占用时间[si,fi),[sj,fj)不重叠，那么就说明这两个活动是兼容的，也就是说当sj>=fi或者si>=fj那么活动ai,aj是兼容的。在活动选择问题中，我们希望选出一个最大兼容活动集，即在同一间教室能安排数量最多的活动。

贪心策略

按照结束时间前的，放前面；结束时间一样的，开始时间小的放前面，然后依次相加

贪心证明

贪心的结果集是S, 剩下的集合是T，对于T中的任意一个元素b，都存在一个a属于S, 是a的结束时间大于b的开始时间。

在这里插入图片描述

代码

static bool cmp (const vector<int>&a, const vector<int>&b){
        return a[1]<b[1];
    }
int eraseOverlapIntervals(vector<vector<int>>& vct) {
        sort(vct.begin(),vct.end(),cmp);
        int endtime=vct.front()[1];
        int res=1;
        for(int i=1;i<vct.size();i++){
            if(endtime > vct[i][0]){

            }else{
                endtime=vct[i][1];
                res++;
            }
        }
        return res;
    }

建议

碰到这种问题，用动态规划也能做，而且如果对应的活动有权值，动态规划还一定是正确的。

对任务按照结束时间排序
dp[i][j] i表示从0~i个任务，j表示空余时间，dp[i][j]表示最大解

哈夫曼编码

问题描述

给定一个由n个不同字符组成的字符串，请设计一个哈夫曼编码，使得使用该编码的编码长度最小。

哈夫曼树

定义：给定n个权值作为n个叶子结点的权值，构造一棵二叉树，若该树的带权路径长度达到最小，称这样的二叉树为最优二叉树，也称为哈夫曼树(Huffman Tree)。

解法

统计待编码字符串中每个字符出现的次数，并将这些次数作为权重存储在数组中。
根据权重构建哈夫曼树。在构建过程中，每次从权重数组中取出两个最小的权重，将它们合并为一个新节点，新节点的权重为这两个节点权重之和。然后将新节点加入哈夫曼树，同时从权重数组中删除这两个节点。重复这个过程，直到权重数组为空。
根据哈夫曼树生成哈夫曼编码。对于哈夫曼树的每个叶子节点，从根节点到叶子节点的路径上的每个节点对应一个0或1，将这些0和1按照从根节点到叶子节点的顺序连接起来，就得到了该叶子节点的哈夫曼编码。
使用哈夫曼编码对字符串进行编码。将字符串中的每个字符替换为其哈夫曼编码，然后将编码后的字符串按照哈夫曼编码的规则进行传输或存储。

最小延迟调度问题

问题描述

任务集合S，∀i∈S，di 为截止时间，ti为加工时间，di , ti为正整数。一个调度f : S→N，f(i)为任务i 的开始时间。求最大延迟达到最小的调度，就是所有任务超过截止时间的和最小。

在这里插入图片描述

解决方案

按照结束时间di从小到大排序，安排时不留空余时间

贪心证明

最优解中可以不存在相邻的逆序任务，使得（i,j）: f(i) < f(j) di > dj。（真确解中，交换两个任意的任务，都会使得总任务拖延时间变长）。

找零问题

问题描述

考虑用最少的硬币找n美分零钱的问题。假设每种硬币的面额都是整数。设计贪心算法求解找零问题，假定有25美分、10美分、5美分和1美分4种面额的硬币。证明你的算法能找到最优解。

解决方案

按照先尽可能用25美分，然后尽可能用10美分，再尽可能用5美分，最后尽可能用1美分。

贪心证明

假设一个可能的解中，存在两个10，一个5，则可以用25代替，获取到一个更优解。同样递归，直到没有硬币组合能到25，对应着先用25美分的。

图基本算法

广度优先搜索

算法步骤

广度优先搜索（BFS,Breadth First Search），从初始点开始，逐层向前搜索，即第n层搜索未完成，不得进入下一层搜索。

深度优先搜索

算法步骤

深度优先搜索（DFS,Depth First Search），从初始点开始，对每一个可能的分支路径深入到不能再深入为止，而且每个节点只能访问一次

欧拉回路

判定条件

对于图上的任意节点，入度等于出度。

DFS解法

从任意一个起始点v开始DFS遍历，直到再次到达点v，即寻找一个回路。
将此回路定义为C，如果回路C中存在某个点x，其有出边不在回路中，则继续以此点x开始遍历寻找回路C’，将环C、C’连接起来也是一个大回路，如此往复，直到图G中所有的边均已经添加到回路中
显然每条边只会返回一次，所以复杂度为O(E)

用人话说就是：

对任意一个节点A做DFS, 直到终点到了A，对遍历的边进行标记，把所有遍历的边去除。
对任意一个还有边的点B进行DFS，重复操作，直到所有边都被标记。
标记的边就是欧拉回路。

拓扑排序

算法步骤

找到所有入度为0的节点，并加入队列
依次从队列中取出节点，并将其指向的节点的入度减1，如果减1后，该节点的入度为0，则将其加入队列

最小生成树

把所有点都连接起来，使得生成树各边权值之和最小。

prim算法

算法步骤

选择一个节点作为起始点，并将其加入生成树中。
选择与生成树相连的，最小的边，将其加入生成树中。
重复步骤2，直到所有节点都被加入生成树中。

复杂度

使用邻接矩阵表示图： O(V^2) V是顶点数量，每次都要找最小的顶点
使用邻接表表示图： O(ElogV) E是边的数量，每次都要找最小的顶点
（加入新节点的时候，把新节点所有相邻的，不在生成树中的边添加进去）

Kruskal算法

算法步骤

按照边的权值从小到大排序
依次选择边，如果选择后不会形成环，则加入生成树中（使用并查集判断新加入的边是否会形成环）

瓶颈生成树

定义

一个无向图G上的瓶颈生成树是G上一种特殊的生成树。一个瓶颈生成树T上权重最大边的权重是G中所有生成树中最小的。T上最大权重的边的权重称为T的值。就是生成树T，的最大权值，是G中所有生成树中，最大权值的最小值。

单源最短路径

松弛算法

在这里插入图片描述

说人话就是，对于点u --> v , 如果找到另外一个点x，使得u --> x --> v的路径更短，则更新u --> v的路径。后面的Dijkstra算法Bellman-Ford算法是基于这个算法的。

Dijkstra算法

算法步骤

创建一个距离列表，其中包含每个节点到起始节点的距离。起始节点的距离设置为0，其他节点的距离设置为无穷大。
创建一个已访问列表和一个待访问列表。起始节点被标记为已访问，其他所有节点都被标记为待访问。
对于每一个待访问的节点，计算它到起始节点的距离。如果这个距离比当前记录的距离还要短，那么就更新这个节点的距离。
从待访问列表中找到距离最小的节点，将其标记为已访问，并将其从待访问列表中移除。
重复步骤3和4，直到所有的节点都被访问过。
距离列表中记录的就是每个节点到起始节点的最短距离。

缺点

无法解决边值为负值

Bellman-Ford算法

算法步骤

为每个顶点 ’ v '初始化距离数组 dist[]为dist[v] = INFINITY。假设任何顶点（假设为“0”）作为源并分配dist = 0。
根据以下条件放松所有edges（u，v，weight）N-1次：
- dist[v] = 最小值(dist[v]，dist[u] + weight)
现在，再次放松所有边，即第N次，并基于以下两种情况，我们可以检测负循环：
- 情况 1（存在负循环）：对于任何边（u，v，权重），如果 dist[u] + weight < dist[v]
- 情况 2（无负循环）：情况 1 对于所有边均失败。