【算法】算法优化

最新推荐文章于 2024-02-25 14:39:22 发布

CS@zeny

最新推荐文章于 2024-02-25 14:39:22 发布

阅读量897

点赞数

分类专栏：算法笔记文章标签： java 算法

本文链接：https://blog.csdn.net/honorzoey/article/details/121645981

版权

笔记同时被 2 个专栏收录

101 篇文章 10 订阅

订阅专栏

算法

6 篇文章 1 订阅

订阅专栏

本文深入探讨算法优化的重要性，介绍了大O符号表示法，阐述了算法时间复杂度的四种增长率，并通过最大子序列和问题展示了从O(N^3)到O(N log N)的优化过程。此外，还涉及二分查找、欧几里得算法和幂运算的效率分析。

摘要由CSDN通过智能技术生成

算法优化

参考 : 《数据结构与算法分析》. Mark Allen Weiss. 机械工业出版社

第二章:算法分析

文章目录

算法优化

算法( algorithm) 是为求解一个问题需要遵循的、被清楚指定的简单指令的集合。

数学基础

四个定义

如果存在正常数 $c$ 和 $n_0$ ,使得当 $N\geq n_0$ 时 $T(N)\leq cf(N)$ , 则记为 $T (N) = O (f (N))$
- 可以看成 $T (N)$ 的增长率小于或等于 $f (N)$ 的增长率; 时间复杂度常用 $O ()$ 来衡量
如果存在正常数 $c$ 和 $n_0$ , 使得当 $N\geq n_0$ 时 $\geq cg(N)$ , 则记为 $\Omega (g(N))$ 。 $\Omega$ 读音： Omega 
- 可以看成 $T (N)$ 的增长率大于或等于 $g (N)$ 的增长率
$=\theta(h(N))$ 当且仅当 $T (N) = O (h (N))$ 和 $=\Omega(h(N))$ 。 $\theta$ 读音： theta
- 可以看成 $T (N)$ 的增长率等于 $h (N)$
如果对每一正常数 $c$ 都存在常数 $n_0$ , 使得当 $N>n_0$ 时 $T (N) < c p (N)$ , 则 $T (N) = o (p (N))$ 。有时也可以说, 如果 $T (N) = o (p (N))$ 且 $T(N)\ne \theta (p(N))$ , 则 $(p (N))$ 。 可以读成小o
- 可以看成 $T (N)$ 的增长率小于 $p (N)$ 的增长率；与 $O (N)$ 不同的是没有等于。

这些定义的目的是要在函数间建立一种相对的级别。给定两个函数, 通常存在一些点, 在这些点上一个函数的值小于另一个函数的值, 因此, 一般地宣称, 比如说 $f (N) < g (N)$ , 是没有什么意义的。于是, 我们比较它们的相对增长率(relative rate of growth)。当将相对增长率应用到算法分析时,我们将会明白为什么它是重要的度量。

虽然对于较小的N值 $1000 N$ 要比 $N^2$ 大, 但 $N^2$ 以更快的速度增长, 因此 $N^2$ 最终将是更大的函数。在这种情况下, $N = 1000$ 是转折点。第一个定义是说, 最后总会存在某个点 $n_0$ , 从它开始以后 $c \cdot f (N)$ 总是至少与 $T (N)$ 一样大, 从而若忽略常数因子,则 $f (N)$ 至少与 $T (N)$ 一样大。在我们的例子中, $T (N) = 1000 N$ , $f(N)=N^2$ , $n_0=1000$ 而 $c = 1$ ,我们也可以让 $n_0=10$ 而 $c = 100$ 因此,可以说 $1000N=0(N^2)$ (N平方级)。这种记法称为大O标记法。人们常常不说 “…级的”,而是说“大O…"。

法则 1 : 如果 $T_1(N) = O(f(N))$ 且 $T_2(N)=O(g(N))$ , 那么

$T_1(N) + T_2(N) = O(f(N)+g(N))$
- 直观地和非正式地可以写成 $m a x (O (f (N)), O (g (N)))$ , 即从中选出最大的作为结果
$T_1(N)*T_2(N) = O(f(N)*g(N))$

法则 2 ：如果 $T (N)$ 是一个 $k$ 次多项式, 则 $\theta (N^k)$

法则 3 : 对于任意常数 $k$ , $log^k N=O(N)$ 。它告诉我们对数增长得非常缓慢

注意 : 将常数或低阶项放进大 $O$ 是非常坏的习惯。不要写成 $T(N) =O(2N^2)$ 或 $T(N) =O(N^2+N)$ , 在这两种情形下, 正确的形式是 $T(N) =O(N^2)$ 。这就是说,在需要大 $O$ 表示的任何分析中, 各种简化都是可能发生的。低阶项一般可以被忽略, 而常数也可以弃掉。此时, 要求的精度是很粗糙的。

典型的增长率

表格中从上往下函数的增长率在增大, 我们在优化算法的时候一般都是从下往上一级一级优化。比如一般解法的时间复杂度为 $O (N)$ , 那能不能降到 $O(N^2)$ 呢? 当可以降到 $O(N^2)$ 的时候, 再去进一步考虑能否降到 $O (N l o g N)$ 或者 $O (N)$ 。

函数	名称
$c$	常数
$l o g N$	对数
$log^2 N$	对数平方的
$N$	线性的
$N l o g N$
$N^2$	二次的
$N^3$	三次的
$2^N$	指数的

在计算机科学中,除非有特别的声明,否则所有的对数都是以2为底的。因此一般都省略2为底数的写法

比如：当说排序时，普通排序算法的时间复杂度是 $O(N^{2})$ , 或者叫二次的。

问题的规模 :

请添加图片描述

不难发现当运行时间成指数级的, 随着输入的n增大, 问题的规模成指数级爆炸增长, 这样的运行时间是十分糟糕的，因此对算法的时间复杂度的优化是十分有必要的。

运行时间

$T_{avg}(N)$ : 算法对于输入量N所花费的平均运行时间
$T_{worst}(N)$ : 算法对于输入量N所花费的最坏情况的运行时间
显然 $T_{avg}(N) \leq T_{worst}(N)$ ; 平均情形性能常常反映典型的行为, 而最坏情形的性能则代表对任何可能输入的性能的一种保证。

一般法则

法则一 : for循环 :一个for循环的运行时间至多是该for循环内部那些语句(包括测试)的运行时间乘以迭代的次数。

法则二 : 嵌套的for循环 : 从里向外分析这些循环。在一组嵌套循环内部的一条语句总的运行时间为该语句的运行时间乘以该组所有的for循环的大小的乘积。

法则三 : 顺序语句 : 将各个语句的运行时间求和即可(这意味着,其中的最大值就是所得的运行时间)

法则四 : if/else语句 :

if(condition)
    S1
else
    S2

一个if /else语句的运行时间从不超过判断的运行时间再加上 S1 和 S2 中运行时间长者的总的运行时间。

分析的基本策略是从内部(或最深层部分)向外展开工作的。如果有方法调用, 那么要首先分析这些调用。

最大子序列和问题

经典的算法优化问题

问题 : 给定(可能有负数)整数 $A_1, A_2, ..., A_N$ , 求 $\sum\limits_{k=i}^j A_k$ 的最大值。（为了方便起见，设定当所有整数均为负数时，则最大子序列和为0）。
- 比如：对于输入 $- 2, 11, - 4, 13, - 5, - 2$ , 最大子序列和为20 (从 $A_2到A_4$ )
- 子序列是指不改变原序列的连续顺序, 从头部或者是尾部开始进行删减得到的序列

算法思想 :

做法一 : 穷举法 (也称暴力解法)

逐个遍历求和, 比较子序列和大小, 选择最大的一组子序列和
时间复杂度 $T( N ) = O( N^3 )$

int  MaxSubsequenceSum ( const int A[ ],  int  N ) 
{ 
	int  ThisSum,  MaxSum,  i,  j,  k; 
/* 1*/ 	MaxSum = 0;   /* initialize the maximum sum */
/* 2*/ 	for( i = 0; i < N; i++ )  /* start from A[i] */
/* 3*/ 	      for( j = i; j < N; j++ ) {   /* end at A[j] */
/* 4*/ 			ThisSum = 0; 
/* 5*/ 			for( k = i; k <= j; k++ ) 
/* 6*/ 		      ThisSum += A[ k ];  /* sum from A[i] to A[j] */
/* 7*/ 				if ( ThisSum > MaxSum ) 
/* 8*/ 		      	MaxSum = ThisSum;  /* update max sum */
	      		}  /* end for-j and for-i */
/* 9*/ 	return  MaxSum; 
}

分析 :

运行时间为 $O( N^3 )$ , 完全取决于带注释的第5和第6行代码, 他们由三重嵌套for循环中的 $O (1)$ 语句组成, 最外层循环大小为 $N$ 。次外层循环大小为 $N - i$ , 它可能要小,但也可能是 $N$ 。如果假设最坏的情况下, 这可能会使得最终的界有些大。最里层循环的大小为 $j - i + 1$ 我们也要假设它的大小为 $N$ 。因此总数为 $O(1·N·N·N) =O(N^3)$ 。带注释的第1行总共的开销只是 $0 (1$ ), 而带注释的第7和8行也只不过总共开销 $O(N^2)$ , 因为它们只是两层循环内部的简单表达式。

但这样的计算不够精确。更加精确地分析应该是由 $\sum\limits_{i=0}^{N-1} \sum\limits_{j=i}^{N-1} \sum\limits_{k=i}^{j} 1$ 得到的结果, 对该式子从内到外求值。

演算一下 : $\sum\limits_{i=0}^{N-1} \sum\limits_{j=i}^{N-1} \sum\limits_{k=i}^{j} 1$

$\sum\limits_{k=i}^{j} 1= j-i+1$ ; 因为从第i个数到第j个数中间一共有 $(j - i + 1)$ 个数相加, 即 $(j-i+1)\times1$
将 $\sum\limits_{k=i}^{j} 1= j-i+1$ 代入到式子得到 $\sum\limits_{j=i}^{N-1}(j-i+1)$ , 可以把 $(- i + 1)$ 看作常量a, 那么就有 $\sum\limits_{j=i}^{N-1}(j+a) = (i+a)+(i+1+a)+(i+2+a)+...+(N-1+a) = \frac{i+(N-1)}{2}(N-1) + a \times(N-1)=\frac{(N-i+1)(N-i)}{2}$ ,
再将 $\frac{(N-i+1)(N-i)}{2}$ 代入式子有 $\sum\limits_{i=0}^{N-1} \frac{(N-i+1)(N-i)}{2}$ , 因为 $\sum\limits_{i=0}^{N-1}$ 不方便计算, 所以化为 $\sum\limits_{i=1}^{N}$ , 但是怎样能让他们的值不变呢, 细心的话就会发现, 他们都只是都加了1,这里可以把 $N$ 当做是常数, 原来的 $i$ 的范围是 $[0, N - 1]$ , 现在变成 $[1, N]$ , 令 $t = i + 1$ , 即 $i = t - 1$ , 将 $i = t - 1$ 代入进去则有 $\sum\limits_{i=0}^{N-1} \frac{(N-i+1)(N-i)}{2} = \sum\limits_{t=1}^{N} \frac{(N-(t-1)+1)(N-(t-1))}{2} = \sum\limits_{t=1}^{N} \frac{(N-t+2)(N-t+1))}{2}$ 然后换元即可得到 $\sum\limits_{i=1}^{N} \frac{(N-i+2)(N-i+1))}{2}$ , 验算结果和+1之前的一样。
将 $\sum\limits_{i=1}^{N} \frac{(N-i+2)(N-i+1))}{2}$ 中的常数系数 $\frac{1}{2}$ 提取出来, 得到 $\frac{1}{2} \sum\limits_{i=1}^{N} (N-i+2)(N-i+1)$ ; 因为 $N-i+2)(N-i+1)=N^2+i^2-(2N+3)i+3N+2$ , $N$ 为常数,求和中可以提取出来, 所以就有 $\frac{1}{2}\sum\limits_{i=1}^{N}i^2 - (N+\frac{3}{2}) \sum\limits_{i=1}^{N}i+\frac{1}{2}(N^2+3N+2)\sum\limits_{i=1}^{N}1$ , 又 $\sum\limits_{i=1}^{N}i^2=\frac{N(N+1)(2N+1)}{6}$ 这个是公式¹ 就懒得推导了 , $\sum\limits_{i=1}^{N} i = \frac{N(N+1)}{2}$ , 这个就不用证明了, 等差数列求和(都懂).

所以推导的结果为 :

$\begin {aligned} \sum\limits_{i=0}^{N-1} \sum\limits_{j=i}^{N-1} \sum\limits_{k=i}^{j} 1&= \sum\limits_{i=0}^{N-1} \sum\limits_{j=i}^{N-1}(j-i+1) \\ &=\sum\limits_{i=0}^{N-1} \frac{(N-i+1)(N-i)}{2} \\ &= \sum\limits_{i=1}^{N} \frac{(N-i+1)(N-i+2)}{2} \\ &=\frac{1}{2}\sum\limits_{i=1}^{N}i^2 - (N+\frac{3}{2}) \sum\limits_{i=1}^{N}i+\frac{1}{2}(N^2+3N+2)\sum\limits_{i=1}^{N}1 \\ &= \frac{1}{2} \frac{N(N+1)(2N+1)}{6} - (N+\frac{3}{2})\frac{N(N+1)}{2}+\frac{N^2+3N+2}{2} N \\ &= \frac{N^3+3N^2+2N}{6} \end {aligned}$

做法二

改进算法

我们可以通过消除一个for循环来避免三次for循环运行的时间
最里层循环可以省略掉
$T( N ) = O( N^2 )$

int  MaxSubsequenceSum ( const int A[ ],  int  N ) 
{ 
	int  ThisSum,  MaxSum,  i,  j; 
/* 1*/ 	MaxSum = 0;   /* initialize the maximum sum */
/* 2*/ 	for( i = 0; i < N; i++ )  {   /* start from A[ i ] */
/* 3*/ 	      ThisSum = 0; 
/* 4*/ 	      for( j = i; j < N; j++ ) {   /* end at A[ j ] */
/* 5*/ 		ThisSum += A[ j ];  /* sum from A[i] to A[j] */
/* 6*/ 		if ( ThisSum > MaxSum ) 
/* 7*/ 		      MaxSum = ThisSum;  /* update max sum */
	      }  /* end for-j */
	}  /* end for-i */
/* 8*/ 	return  MaxSum; 
}

做法三

进一步改进

分治法, 用递归解决 : 将问题分成两个大致相等的子问题, 然后递归求解
$T (N) = O (N l o g N)$

private static int maxSumRec(int a[],  int left, int right)
{
    if(left==right)
        if(a[left]>0)
            return a[left];
        else
            return 0;

    int center = (left+right)/2;
    int maxLeftSum = maxSumRec(a, left, center); //左半部分递归调用, 选出最大值
    int maxRightSum = maxSumRec(a, center+1, right); //右半部分递归调用, 选出最大值

    int maxLeftBorderSum = 0, leftBorderSum = 0;
    for(int i=center; i>=left; i--){
        leftBorderSum += a[i];
        if(leftBorderSum>maxLeftBorderSum)
            maxLeftBorderSum = leftBorderSum;
    }

    int maxRightBorderSum = 0, rightBorderSum = 0;
    for(int i=center+1; i<=right; i++){
        rightBorderSum += a[i];
        if(rightBorderSum>maxRightBorderSum)
            maxRightBorderSum = rightBorderSum;
    }

    return max3(maxLeftSum, maxRightSum, maxLeftBorderSum+maxRightBorderSum);//选出三个数中最大的数
}

public static int max3(int num1, int num2, int num3){
//  return (num1>Math.max(num2,num3))?num1:Math.max(num2,num3); //比较三个数的大小, 这里就懒得写太多, 直接用java中Math类的静态方法max(); 但这个只能比较两个数的大小, 所以又用了三目运算来比较大小
    return Math.max(num1, Math.max(num2,num3));  //全都直接用Math类的max方法
}

public static int maxSubSum3(int[] a){
    return maxSumRec(a, 0, a.length-1);
}

时间分析 :

令 $T (N)$ 是求解大小为 $N$ 的最大子序列和问题所花费的时间。如果 $N = 1$ , 则执行程序第3行到第7行花费某个常数时间量, 我们设为一个时间单位。于是, $T (1) = 1$ 。否则, 程序必须运行两个递归调用,即在第14行和第25行之间的两个for循环, 以及某个小的簿记量, 如第9行和第13行。这两个for循环总共接触到数组 $A$ , 从 $A_0$ 到 $A_{N-1}$ 的每一个元素,而在循环内部的工作量是常量, 因此, 在第14到25行花费的时间为 $O (N)$ 。在第3行到第9行和27行上的程序的工作量都是常量, 从而与 $O (N)$ 相比可以忽略。其余就是第10、11行上的递归调用运行的工作。这两行求解大小为 $N / 2$ 的子序列问题 (假设 $N$ 是偶数)。因此, 这两行每行花费 $T (N / 2)$ 个时间单元, 共花费 $2\times T(N/2)$ 个时间单元。因此总的时间为 $2\times T(N/2)+O(N)$

得到方程组 :

$\begin{cases} T(1) = 1 \\ \\ T(N) = 2T(N/2) + O(N) \end{cases}$

为了简化计算, 可以用 $N$ 代替 $O (N)$ , 所以 $T (N) = 2 T (N / 2) + N$ , 因为 $T (1) = 1$ , 则可推出 $2T(1)+2=4=2\times2, T(4)=2T(2)+4=12=4\times3, T(8)=2T(4)+8=32=8\times 4, ....$ 依次类推可推出 $T(N)=N\times(k+1)$ 可用数学归纳法证明, 假设 $N=2^k$ (因为前面假设 $N$ 为偶数), 则 $T(N)=N\times(k+1)=NlogN+N$

则有 : $\begin {aligned}T(N) &= 2T(N/2) + N \\ &= N \times (k+1) \\ &= NlogN+N \\ &=O(NlogN) \end {aligned}$

这个分析假设 $N$ 是偶数, 否则 $N / 2$ 就不确定了。通过该分析的递归性质可知, 实际上只有, 当 $N$ 是2的幂时结果才是合理的, 否则我们最终要得到大小不是偶数的子问题, 方程就是无效的了。当 $N$ 不是2的幂时, 我们多少需要更加复杂一些的分析, 但是大 $O$ 的结果是不变的。

做法四：

将时间复杂度降为 $O (N)$

动态规划的做法:

设前 $n$ 项数字的最大子序列和为 $f (n)$ , 则:

$\begin{cases} 0{\quad},{\quad} n=0 \\ a_n{\quad}, {\quad}f(n-1)\leq0 \\ f(n-1)+a_n {\quad}, {\quad}f(n-1) > 0 \end{cases}$
可以看出只有一层for循环, 所以时间复杂度为 $O (N)$
$T (N) = O (N)$

int MaxSubsequenceSum( const int  A[ ],  int  N ) 
{ 
	int  ThisSum, MaxSum, j; 
/* 1*/ 	ThisSum = MaxSum = 0; 
/* 2*/ 	for ( j = 0; j < N; j++ ) { 
/* 3*/ 	      ThisSum += A[ j ]; 
/* 4*/ 	      if  ( ThisSum > MaxSum ) 
/* 5*/ 		MaxSum = ThisSum; 
/* 6*/ 	      else if ( ThisSum < 0 ) 
/* 7*/ 		ThisSum = 0;
	}  /* end for-j */
/* 8*/ 	return MaxSum; 
}

二分查找

折半查找 (binary search)
折半查找:给定一个整数 $X$ 和整数 $A_0, A_1,.., A_{N-1}$ , 后者已经预先排序并在内存中, 求下标 $i$ 使得 $A_i=X$ , 如果 $X$ 不在数据中, 则返回 $i = - 1$ 。

int BinarySearch ( const ElementType  A[ ], 
			    ElementType  X,  int  N ) 
{ 
	int  Low, Mid, High; 
/* 1*/ 	Low = 0;  High = N - 1; 
/* 2*/ 	while ( Low <= High ) { 
/* 3*/ 	      Mid = ( Low + High ) / 2; 
/* 4*/ 	      if ( A[ Mid ] < X ) 
/* 5*/ 		Low = Mid + 1; 
	      else 
/* 6*/ 		if ( A[ Mid ] > X ) 
/* 7*/ 		      High = Mid - 1; 
		else 
/* 8*/ 		      return  Mid; /* Found */ 
	}  /* end while */
/* 9*/ 	return  NotFound; /* NotFound is defined as -1 */ 
}

欧几里得算法

在欧几里德算法中，一次迭代中余数并不按照一个常数因子递减。但可以证明，在两次迭代后，余数最多是先前值的一半，因此迭代次数至多是 $2 l o g N = O (l o g N)$
定理 : 如果 $M > N$ , 则 $M$ mod $N < M / 2$ .
- 证明: 存在两种情形。如果 $N < M / 2$ , 则由于余数小于 $N$ , 故定理在这种情形下成立。另一种情形是 $N > M / 2$ , 但是此时 $M$ 仅含有一个 $N$ 从而余数为 $M - N < M / 2$ , 定理得证。

unsigned int Gcd ( unsigned int  M,  unsigned int  N ) 
{ 
	unsigned int Rem; 
/* 1*/ 	while ( N > 0 ) { 
/* 2*/ 	      Rem = M % N; 
/* 3*/ 	      M = N; 
/* 4*/ 	      N = Rem; 
	} /* end while */
/* 5*/ 	return M; 
}

幂运算

时间复杂度 : $O (N)$

long int Pow ( long int  X,  unsigned int  N ) 
{ 
	long int  P = 1;
	while ( N -- )    P *= X;
	return  P;
}

改进 :

时间复杂度 : $2 l o g N = O (l o g N)$

long int Pow ( long int  X,  unsigned int  N ) 
{ 
/* 1*/ 	if ( N == 0 ) 
/* 2*/ 	      return 1; 
/* 3*/ 	if ( N == 1 ) 
/* 4*/ 	      return X; 
/* 5*/ 	if ( IsEven( N ) ) 
/* 6*/ 	      return Pow( X, N / 2 ) * Pow( X, N / 2 ); 
		else 
/* 7*/ 	      return Pow( X, N / 2 ) * Pow( X, N / 2 ) * X; 
}