图解外部排序之替换选择

阅读说明:
本文总结自《数据结构与算法分析(C++语言描述)》第四版第7章外部排序的内容。

[上一篇][1]文章已经剖析过外部排序的两种优化策略,多路合并(减少合并所需趟数)和多相合并(减少所需磁带数),今天介绍另外一种优化策略——替换选择(减少合并所需趟数)。

简单了解

替换选择从顺串的构造入手,即考虑每一趟排序中如何构造记录数更多的顺串。先复习下顺串的概念——一组排过序的记录,也就是有序的记录集。
无序的原始数据

在内存容量为 3 个记录大小 时,两路合并产生的 5 个顺串如下,

从上一篇多路合并的例子可以看出,除第一趟外,每趟的第一个顺串均比前一趟的第一顺串的记录数多,
第一趟,第一个顺串长度为3,如下

第二趟,第一个顺串长度为6,如下

因此大胆假设,如果能构造出包含更多记录数的初始顺串,就能减少总趟数。替换选择平均能产生 2 倍于内存容量大小的顺串,但这是有条件的,那就是输入数据常常是已排序或几乎被排序(书上原文,本人没懂)。

替换选择之最小堆

使用最小堆来实现替换选择。
在标准的外排中,一次读入内存可容纳的 M 个记录,排序完依次输出到空磁带上;但这里其实有个小技巧,排完序后输出第一个记录到磁带上时,内存让出了一个记录的空间,这时我们可以从输入磁带取出一个记录,判断它是否大于刚输出的记录,若是,说明它可以放入当前顺串中(顺串是从小到大有序),否则,应暂存内存,等下一个顺串的构造;
这里暂存内存书上讲是放在最小堆的死区(dead space),但是并未解释死区是什么,我认为是最小堆执行 deleteMin 操作后让出来的位置,也就是 deleteMin 之前堆的最后一个元素的位置。如下所示,最小堆的 一次 deleteMin操作,

替换选择构造详解

初始顺串的构造详解,绿色箭头表示当前输入状态,Tbn 表示输出状态,内存缓冲表示当前内存中存在的记录(括号内记录表示存在最小堆的死区)

从上图可知,与标准顺串构造方式生成的 5 个顺串相比,替换选择构造的初始顺串记录数更多,顺串数更少,只有 3 个,且前者需要 12 趟完成排序,替换选择只需 3 趟。

外部排序剖析-以磁带为例

### 回答1: 可以的,下面是Java中选择排序图解说明: 选择排序是一种简单的排序算法,其基本思想是找到最小值,并将其放在序列的起始位置,然后重复这个过程直到整个序列都有序为止。 以下是Java中选择排序的实现过程及图解说明: ``` public static void selectionSort(int[] arr) { int n = arr.length; for (int i = 0; i < n - 1; i++) { int minIndex = i; for (int j = i + 1; j < n; j++) { if (arr[j] < arr[minIndex]) { minIndex = j; } } int temp = arr[i]; arr[i] = arr[minIndex]; arr[minIndex] = temp; } } ``` 首先,找到数组中最小的元素,然后将它和数组的第一个元素交换位置。接着,在剩下的元素中找到最小的元素,将它和数组的第二个元素交换位置。不断重复这个过程,直到整个数组有序。 例如,假设有一个未排序的数组arr=[5, 2, 4, 6, 1, 3],其选择排序过程如下所示: 1. 第一次遍历,找到最小元素1,并将其与第一个元素5交换位置,数组变为[1, 2, 4, 6, 5, 3]。 2. 第二次遍历,从第二个元素2开始,找到剩余元素中的最小元素2,并将其与第二个元素2交换位置,数组变为[1, 2, 4, 6, 5, 3]。 3. 第三次遍历,从第三个元素4开始,找到剩余元素中的最小元素3,并将其与第三个元素4交换位置,数组变为[1, 2, 3, 6, 5, 4]。 4. 以此类推,直到整个数组有序。 这就是选择排序的基本实现过程,它可以确保数组中的元素按升序排列。 ### 回答2: 选择排序是一种简单但低效的排序算法,其基本思想是每次从待排序的元素中选出最小(或最大)的一个元素,依次放置到已排序的序列的末尾,直到所有元素都排好序为止。下面是用图解的方式说明选择排序的过程。 假设有一个待排序的数组arr,初始状态下数组为[5,4,3,2,1]。 首先,我们从数组中找到最小的元素,在这里是1,并将其与第一个元素交换位置,此时数组变为[1,4,3,2,5]。 然后,从剩下的四个元素中找到最小的元素,即2,将其与第二个元素交换位置,数组变为[1,2,3,4,5]。 接着,从剩下的三个元素中找到最小的元素,即3,将其与第三个元素交换位置,数组变为[1,2,3,4,5]。 继续,找到最小的元素4,将其与第四个元素交换位置,数组不变。 最后,数组中只剩下一个元素5,已经排好序。 通过图解可以清楚地看到选择排序的过程。每次在剩下的元素中找到最小的元素,并把它放在正确的位置。这个过程是逐渐地形成有序部分的过程,直到数组全部有序。 需要注意的是,选择排序的时间复杂度为O(n^2),其中n为数组的长度。由于每次只找到一个最小元素,并将其放在正确的位置,所以即便数组已经有序,算法也需要进行完整的比较和交换的过程。因此,相比于其他更高效的排序算法,选择排序并不是一个性能很好的选择。 ### 回答3: 选择排序是一种简单直观的排序算法。它的核心思想是在未排序序列中找到最小(或最大)的元素,将其放到已排序序列的末尾。 在图解选择排序的过程中,我们假设有一个待排序数组{64, 25, 12, 22, 11}: 1. 首先,从待排序序列中找到最小的元素,即11。 2. 将最小元素与待排序序列的第一个元素进行交换,此时得到的序列是{11, 25, 12, 22, 64}。 3. 接下来,在剩余的序列中找到最小的元素,即12。 4. 将最小元素与待排序序列的第二个元素进行交换,此时得到的序列是{11, 12, 25, 22, 64}。 5. 继续按照上述步骤,在剩余的序列中找到最小的元素,并依次将其与待排序序列中的元素进行交换,得到最终排序后的序列{11, 12, 22, 25, 64}。 选择排序的过程可以用下图表示: 初始状态:[64, 25, 12, 22, 11] 第一次选择:[11, 25, 12, 22, 64] 第二次选择:[11, 12, 25, 22, 64] 第三次选择:[11, 12, 22, 25, 64] 第四次选择:[11, 12, 22, 25, 64] 通过不断选择排序序列中的最小(或最大)元素并交换,就可以逐步将数组从小到大(或从大到小)进行排序选择排序的时间复杂度为O(n^2),其中n为数组长度。尽管选择排序不是最高效的排序算法,但由于其实现简单,对于小规模数组仍然是一种不错的选择
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值