分类目录:《算法设计与分析》总目录
相关文章:
· 顺序统计量:最大值与最小值
· 顺序统计量:期望为线性时间的选择算法
· 顺序统计量:最坏情况为线性时间的选择算法
我们现在来看一个最坏情况运行时间为
O
(
n
)
O(n)
O(n)的选择算法。像randomized_select(arr, low, high, i)
一样, 下文所述的选择算法通过对输入数组的递归划分来找出所需元素,但是,在该算法中能够保证得到对数组的一个好的划分。 该算法使用的也是来自《排序算法:快速排序-[基础知识]》中的确定性划分算法partition(arr,low,high)
,但做了修改,把划分的主元也作为输入参数。
通过执行下列步骤,该算法可以确定一个有 n > 1 n>1 n>1个不同元素的输入数组中第 i i i小的元素。
- 将输入数组的 n n n个元素划分为 ⌊ n 5 ⌋ \lfloor\frac{n}{5}\rfloor ⌊5n⌋组,每组5个元素,且至多只有一组由剩下的 n m o d 5 个 n\mod 5个 nmod5个元素组成。
- 寻找这 ⌈ n 5 ⌉ \lceil\frac{n}{5}\rceil ⌈5n⌉组中每一组的中位数:首先对每组元素进行插入排序,然后确定每组有序元素的中位数。
- 对第2步中找出的 ⌈ n 5 ⌉ \lceil\frac{n}{5}\rceil ⌈5n⌉个中位数,递归调用本算法以找出其中位数 x x x。
- 利用修改过的
partition(arr,low,high)
版本,按中位数的中位数 x x x对输入数组进行划分。让 k k k比划分的低区中的元素数目多1,因此 x x x是第 k k k小的元素,并且有 n − k n-k n−k个元素在划分的高区。 - 如果 i = k i=k i=k,则返回 x x x。如果 i < k i<k i<k,则在低区递归调用本算法来找出第i小的元素。如果 i > k i>k i>k,则在高区递归查找第 i − k i-k i−k小的元素。
上图给出了算法的形象的说明。在第2步找出的中位数中,至少有一半大于或等于中位数的中位数
x
x
x。因此,在这
⌈
n
5
⌉
\lceil\frac{n}{5}\rceil
⌈5n⌉个组中,除了当
n
n
n不能被5整除时产生的所含元素少于5的那个组和包含
x
x
x的那个组之外,至少有一半的组中有3个元素大于
x
x
x。不算这两个组,大于
x
x
x的元素个数至少为
3
n
10
−
6
\frac{3n}{10}-6
103n−6。在上图中,所有
n
n
n个元素都由小圈来表示,并且每一组的5个元素在同一列上。其中,每组的中位数用白色圈表示,而中位数的中位数
x
x
x也被标识出来(当查找偶数个元素的中位数时,使用较小的中位数)。箭头从较大的元素指向较小的元素,从图中可以看出,在
x
x
x的右边,每一个包含5个元素的组中有3个元素大于
x
x
x。在
x
x
x的左边,每一个包含5个元素的组中有3个元素小于
x
x
x,大于
x
x
x的元素的背景以阴影来显示。所以,基于以上逻辑的选择算法最坏时间复杂度也可以控制在
Θ
(
n
)
\Theta(n)
Θ(n)。