0102分析算法-算法基础-算法导论第三版

gaog2zh

于 2024-03-20 21:23:04 发布

阅读量593

点赞数 15

分类专栏：数据结构和算法文章标签：算法分析算法基础算法导论

本文链接：https://blog.csdn.net/gaogzhen/article/details/136889145

版权

数据结构和算法专栏收录该内容

58 篇文章 3 订阅

订阅专栏

1 算法分析概述（实现技术的模型）

分析算法目的：预测算法需要的资源。

资源度量：

计算时间
硬件资源，比如内存、通信带宽等

tip：随着现代技术水平进步和工艺提升，硬件资源逐渐提高，我们更关心时间问题。

在能分析一个算法之前，我们必须有一个要使用的实现技术的模型，包括描述所有资源及其代价的模型。我们假定一种通用的单处理器计算模型-随机访问（random-access machine，RAM）来作为我们的实现技术，算法可以用计算机程序实现。在RAM模型中，指令一条接一条的执行，没有并发操作。

RAM模型指令及其代价：
- 真实计算机常见指令：算术指令、数据移动指令（装入、存储、复制）和控制指令（条件与无条件转移、子进程调用与返回）。
- 每条这样的指令所需时间都为常量。
RAM模型的数据类型：
- 整数型和浮点实数型。
- 我们对每个数据字的规模假定一个范围
在RAM模型中，我们不对当代计算机中常见的内存层次进行建模。

我们想要一种表示方法，它的书写和处理都比较简单，并能够表明算法资源需求的重要特征，同时能够抑制乏味的细节。

2 插入排序算法的分析

过程INSERTION-SORT需要的时间依赖：

输入规模
排序程序

一般来说，算法需要的时间与输入的规模同步增长，所以通常把一个程序的运行时间描述成器输入规模的函数。

输入规模的最佳概念依赖于研究的问题。对许多问题，如排序或快速傅里叶变换，最自然的度量是输入中的项。对于其他问题，如两个整数相乘，输入规模的最佳度量是用通常的二进制记号表示输入所需的总位数。有时，用两个数而不是一个数来描述输入规模更合适，比如输入是一个图，则输入规模可以用该图中的定点数和边数描述。

一个算法再特定输入上的运行时间是指执行的基本操作数或步数。定义“步”的概念以便尽量独立于机器。目前，我们采纳一下观点：执行每行伪代码需要常量时间，假定第 $i$ 行的每次执行时间为 $c_i$ （是一个常量），一行与另一行可能不同。

我们首先给出过程INSERTION-SORT中，每条语句的执行时间和执行次数。对 $j=2,3,\cdots,n,n=A.length$ ，假设 $t_j$ 表示对第5行执行while测试的次数。当一个for或者while循环按通常的方式（即由于循环头中的测试）退出时，执行测试的次数比执行循环体的次数多1.我们假定住宿是不可执行的语句，所以它们不需要时间。

行	伪代码	代价	次数
1	for $j = 2$ to A.length	$c_1$	n
2	$k ey = A [j]$	$c_2$	n-1
3	// 把 $A [j]$ 插入有序子数组 $A[1\cdots j-1]$	0	n-1
4	$i = j - 1$	$c_4$	n-1
5	$0\quad and\quad A[i] \gt key$	$c_5$	$\sum_{j=2}^n t_j$
6	$A [i + 1] = A [i]$	$c_6$	$\sum_{j=2}^n (t_j-1)$
7	i = i - 1	$c_7$	$\sum_{j=2}^n (t_j-1)$
8	A[i+1] = key	$c_8$	n -1

该算法的运行时间是执行每条语句的运行时间之和。需要执行 $c_i$ 步且执行 $n$ 次的一条语句将贡献 $c_i n$ 给运行时间。计算具有n个输入的INSERTION-SORT的运行时间 $T [n]$ 为：

$T[n]=c_1n+c_2(n-1)+c_4(n-1)+c_5\sum_{j=2}^nt_j+c_6\sum_{j=2}^n(t_j-1)+c_7\sum_{j=2}^n(t_j-1)+c_8(n-1)$

依据输入规模n个数已被排序的程序，如输入数组已排序，则出现最佳情况。当 $j=2,3,\cdots,n$ 时，第5行，当 $1时，都有A[i]\ge key，此时t_j=1$ ,则运行时间：

$T[n]=c_1n+c_2(n-1)+c_4(n-1)+c_5(n-1)++c_8(n-1)=(c_1+c_2+c_4+c_5+c_8)n-(c_2+c_4+c_5+c_8)$

我们可以把运行时间表示为 $an+b,常量a和b依赖于语句代价c_i$ ，它是n的线性函数。

若输入数组已反向排序，则导致最坏情况：
$j=2,3,\cdots,t_j=j\\ \sum_{j=2}^nj=\frac{n(n+1)}{2}-1\\ \sum_{j=2}^n(j-1)=\frac{n(n-1)}{2}\\ T(n)=c_1n+c_2(n-1)+c_4(n-1)+c_5[\frac{n(n+1)}{2}-1]+c_6[\frac{n(n-11)}{2}]+c_7[\frac{n(n-1)}{2}]+c_8(n-1)\\ =(\frac{c_5}{2}+\frac{c_6}{2}+\frac{c_7}{2})n^2+(c_1+c_2+c_4+c_8+\frac{c_5}{2}-\frac{c_6}{2}-\frac{c_7}{2})n-(c_2+c_4+c_5+c_8)$
我们可以把最坏情况运行时间表示为 $an^2+bn+c,其中常量a,b,c依赖于语句代价c_i$ ，因此它是n的二次函数。