[算法导论][思考题]2

cloudblaze

于 2021-05-18 10:31:01 发布

阅读量283

点赞数

分类专栏：算法导论

本文链接：https://blog.csdn.net/cloudblaze/article/details/116775969

版权

算法导论专栏收录该内容

11 篇文章

订阅专栏

本文探讨了归并排序中结合插入排序优化的策略，分析了在不同子列表长度kkk下，排序与合并操作的时间复杂度。通过证明，展示了在最坏情况下，算法如何在Θ(nk+nlog2(n/k))时间内完成，同时讨论了kkk的最佳取值以匹配标准归并排序的时间复杂度。此外，还对比了冒泡排序的正确性和效率，以及霍纳规则在多项式求值中的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2-1

(在归并排序中队小数组采用插入排序) 虽然归并排序的最坏情况运行时间为 $\Theta(n^2)$ ，但是插入排序中的常量因子可能使得它在 $n$ 较小时，在许多机器上实际运行得更快。因此，在归并排序中当子问题变得足够小时，采用插入排序使得递归的叶变粗是有意义的。考虑对归并排序的一种修改，其中使用插入排序来排序长度为 $k$ 的 $n / k$ 个子表，然后使用标准的合并机制来合并这些子表，这里 $k$ 是一个特定的值。

证明：插入排序最坏情况可以在 $\Theta(nk)$ 时间内排序每个长度为 $k$ 的 $n / k$ 个子表。
表明在最坏情况下如何在 $\Theta(nlog_2(n/k))$ 时间内合并这些子表。
假定修改后的算法的最坏情况运行时间为 $\Theta(nk+nlog_2(n/k))$ ，要使修改后的算法与标准的归并排序有相同的运行时间，作为 $n$ 的一个函数，借助 $\Theta$ 记号， $k$ 的最大值是多少？
在实践中，我们应该如何选择 $k$ ？

答：

在最坏情况下，使用插入排序排序一个长度为 $k$ 的列表的运行时间是 $\Theta(k^2)$ 。因此，在最坏情况下，排序 $n / k$ 个子列表（每个子列表的长度为 $k$ ）的运行时间是 $\Theta(k^2 \cdot n/k)=\Theta(nk)$ 。
我们有 $n / k$ 个子列表每一个子列表的长度是 $k$ 。为了合并这 $n / k$ 个已排序的子列表成为一个长度为 $n$ 的单一已排序的列表，我们必须每次合并2个子列表。如果两两为一组的子列表合并完了，就继续再两两一组。这需要花费我们 $log_2(n/k)$ 步，并且每一步需要比较 $n$ 个元素。所以，在最坏情况下，合并这些子列表所花费的时间是 $\Theta(n \cdot log_2(\frac{n}{k}))$ 。
当 $\Theta(nk+n\cdot log_2(\frac{n}{k})) = \Theta(n\cdot log_2n)$ 时，修改后的算法具有普通合并排序的算法复杂度。假定 $\Theta(log_2n)$ ，
$\Theta(nk + n\cdot log_2(\frac{n}{k})) = \Theta(nk + n\cdot log_2n - n\cdot log_2k)$
$\Theta(n\cdot log_2n + n\cdot log_2n - n\cdot log_2(log_2n))$
$=\Theta(2n\cdot log_2n - n\cdot log_2(log_2n))$
$=\Theta(n\cdot log_2n)$ 。
将 $k$ 选定为当插入排序比合并排序更快时，子列表的最大长度。

2-2

（冒泡排序的正确性）冒泡排序是一种流行但低效的排序算法，它的作用是反复交换相邻的未按次序排列的元素。

BUBBLESORT(A)
	for i = 1 to A.length - 1
		for j = A.length downto i + 1
			if A[j] < A[j - 1]
				exchange A[j] with A[j - 1]

假设 $A^{'}$ 表示BUBBLESORT(A)的输出。为了证明BUBBLESORT正确，我们必须证明它将终止并且有：
$A'[1]\leqslant A'[2]\leqslant A'[3]\leqslant \cdots\leqslant A'[n]$
其中 $n = A . l e n g t h$ 。为了证明BUBBLESORT确实完成了排序，我们还需要证明什么？
下面两部分将证明不等式。
为第2~4行的for循环精确地说明一个循环不变式，并证明该循环不变式成立。你地证明应该使用本章给出地循环不变式证明地结构。
使用(2)部分证明的循环不变式的终止条件，为第1~4行的for循环说明一个循环不变式，该不变式将使你能证明不等式。你的证明应该使用本章给出的循环不变式证明的结构。
冒泡排序的最坏情况运行时间是多少？与插入排序的运行时间相比，其性能如何？

答：

$A^{'}$ 是由 $A$ 中的元素组成，且是按顺序排列的。
证明过程需要完善
循环不变式为第1-4行的for循环在第 $i$ 次循环之前， $A [1 . . i - 1]$ 已排好序，且 $A [1]$ 为数组 $A$ 最小的元素，数组 $A [2]$ 为次小的元素，等等。数组 $A$ 剩余的元素 $A [i . . A . l e n g t h]$ 即为未排序的元素。初始化：在第1次循环之前， $i$ 的值是1，数组 $A [1 . . i - 1]$ 为空，因为在初始化的时候所有元素均未排序，故循环不变式成立。保持：在第 $i$ 次循环开始之前，数组 $A [1 . . i - 1]$ 中的依次从小到大排列，且是数组 $A$ 中最小的 $i - 1$ 个元素。在第 $i$ 次循环中，数组 $A [i + 1 . . A . l e n g t h]$ 中最小的元素会逐步冒泡“上升”到数组 $A$ 的第 $i$ 个位置。所以，当前循环结束后，第 $i$ 个位置的位置即为数组 $A$ 中“第 $i$ 小”的元素。因此，循环不变式保持成立。终止：循环终止条件为 $i = = A . l e n g t h$ ，此时 $A [1 . . i - 1]$ 中的元素即为数组 $A$ 中的所有元素除最大的元素之外的所有元素，且已按从小到大的顺序排列，因 $A [A . l e n g t h]$ 就是数组 $A$ 中的仅剩的元素，也是最大元素，所以数组 $A$ 中的所有元素均已被排序。
冒泡排序的结果是数组 $A$ 中的元素以从小到大的顺序排列。最坏情况是，原始情况下数组 $A$ 以从大到小的顺序排列。这个时候，对于第2行的for循环的每次迭代，第3行的的判断均成立，故第4行的交换均执行。所以，对于第1行的for循环的 $i$ ，第4行的执行次数为 $A . l e n g t h - i$ ，假设交换数组元素所需的运行时间为c，则冒泡排序总共所需运行时间为 $\sum _{1}^{n-1}c(n - i) = \frac{cn(n-1)}{2}$ 。故，冒泡排序的最坏情况运行时间是 $\Theta(n^2)$ ，与插入排序相比，所需的运行时间是一样的。

2-3

（霍纳（Horner）规则的正确性）给定系数 $a_0，a_1，\cdots，a_n$ 和 $x$ 的值，代码片段

y = 0
for i = n downto 0
	y = ai + x*y

实现了用于求职多项式
$\sum_{k = 0}^{n}a_kx^k = a+0 + x(a_1 + x(a_2 + \cdots + x(a_{n-1} + xa_n)\cdots))$
的霍纳规则。

借助 $\Theta$ 记号，实现霍纳规则的以上代码片段的运行时间是多少？
编写伪代码来实现朴素的多项式求值算法，该算法从头开始计算多项式的每个项。该算法的运行时间是多少？与霍纳规则相比，其性能如何？
考虑以下循环不变式：
在第2~3行for循环每次迭代的开始有
$\sum_{k = 0}^{n-(i + 1)}a_{k + i + 1}x^k$
把没有项的和式解释为等于0。准找本章中给出的循环不变式证明的结构，使用该循环不变式来证明终止时有 $\sum_{k = 0}^{n}a_kx^k$ 。
最后证明上面给出的代码片段将正确地求由系数 $a_0，a_1，\cdots，a_n$ 刻画地多项式的值。

答：

实现霍纳规则的以上代码片段的运行时间是 $\Theta(n)$ 。
朴素的多项式求值算法：

sum = 0
pow = 1
for 0 downto n
	sum += ai * pow
	pow *= x

该算法的运行时间是 $\Theta(n)$ 。该算法的性能霍纳规则是一样的。

第2~3行for循环不变式为每次迭代开始之前 $\sum_{k = 0}^{n - (i + 1)}a_{k + i + 1}x^k$ 。初始化：当第一次循环之前，和式中没有项，故y = 0。保持：在第 $i$ 次迭代之后，我们有
$a_i + x\sum_{k = 0}^{n - (i + 1)}x^k$
$a_ix^0 + x\sum_{k = 0}^{n - i - 1}a_{k + i + 1}x^{k + 1}$
$a_ix^0 + \sum_{k = 1}{n - i}a_{k + i}x^k$
$\sum_{k = 0}^{n - i}a_{k + i}x^k$
终止：当 $i = - 1$ 时，循环结束。此时
$\sum_{k = 0}^{n - i - 1}a_{k + i + 1}x^k = \sum_{k = 0}^na_kx^k$ 。
循环的不变量是一个等于一个具有给定系数的多项式的和。

2-4

（逆序对）假设 $A [1 . . n]$ 时一个有 $n$ 个不同数的数组。若 $i < j$ 且 $A [i] > A [j]$ ，则对偶 $(i, j)$ 称为 $A$ 的一个逆序对(inversion)。

列出数组 $< 2, 3, 8, 6, 1 >$ 的5个逆序对。
有集合 $\cdots, n}$ 中的元素构成的什么数组具有最多的逆序对？她有多少逆序对？
插入排序的运行时间与输入数组中逆序对的数量之间是什么关系？证明你的回答。
给出一个确定在 $n$ 个元素的任何排列中逆序对数量的算法，最坏情况需要 $\Theta(n\cdot log_2n)$ 时间。（提示：修改该归并算法。）

答：

$< 1, 5 > 、 < 2, 5 > 、 < 3, 4 > 、 < 3, 5 > 、 < 4, 5 >$ 。
如果集合 $\cdots, n}$ 中的元素是以降序排列的，那么组成的逆序对最多。它有 $\frac{n(n-1)}{2}$ 个逆序对。
如果输入数组中的逆序对数量越多，则插入排序的运行时间就越大。对于数组中的的逆序对 $< i, j >$ ，在应用插入排序的时候，为了保证数组按正序排列，必定会交换逆序对 $< i, j >$ 。每一个逆序对会花费时间 $t$ ，那么在排序数组的时候，总共花费的时间就是逆序对的数目 $m\cdot t$ 。所以，插入排序的运行时间与输入中逆序对的数量之间呈正比关系。

INVERSION-MERGE(A, p, q, r)
	result = 0
	for m = p to to q
		for n = q + 1 to r
			if A[m] < A[n]
				break
			result++
	
	n1 = q - p + 1
	n2 = r - q
	let L[1 .. n1] and R[1 .. n2] be new arrays
	for i = 1 to n1
		L[i] = A[p + i - 1]
	for j = 1 to n2
		R[j] = A[q + j]
	i = 1
	j = 1
	for k = p to r
		if L[i] <= R[j]
			A[k] = L[i]
			i = i + 1
		else
			A[k] = R[j]
			j = j + 1
	
	return result

INVERSION-SORT(A, p, r)
	result = 0
	if p < r
		q = (p + r) / 2
		result += INVERSION-SORT(A, p, q)
		result += INVERSION-SOFT(A, q + 1, r)
		result += INVERSION - MERGE(A, p, q, r)
	return result