问题描述
给一个 n 个数字的顺序表,求其中的最大值和次大值。求一个比较次数不大于 n − ⌈ l o g n ⌉ − 2 n-\lceil logn \rceil-2 n−⌈logn⌉−2 的算法。
算法
顺序比较
初始化最大值和次大值是下标为 0 的元素,之后每次更新最大值时,把上次最大值给次大值;不能更新最大值时也要和次大值比较看能否更新次大值。易得最坏情况下比较次数为 2 ( n − 1 ) 2(n-1) 2(n−1)。
堆
我们发现,堆的结构可以在常数时间内找到最大值和次大值。但是在构建堆的时候,每次调整的比较次数约为 2 h 2h 2h,其中h为当前子堆的高度。合计下来总比较次数上界为 4 n 4n 4n。这样显然不太划算。
树形选择排序
这是个排序算法,又称锦标赛排序。实际上,堆的结构是在这个结构的基础上优化的,因为这种结构比较浪费空间,但优点是比较次数较少,对于每次选择仅需要优秀的 ⌈ l o g n ⌉ \lceil logn \rceil ⌈logn⌉ 的比较次数。根据这个思想我们构建这样的锦标赛树,实际上是一棵近似完全二叉树的树,为了实现方便不再补满二叉树。然后可以在 n − 1 n-1 n−1 的比较次数内完成对这个树的构建,构建顺序自底向上,最后树根即为最大值;对于次大值可以根据最大值到达叶子节点的路径中,找到每个非终端节点的另一个子节点,次大值从这些节点中诞生,比较次数为 ⌈ l o g n ⌉ − 1 \lceil logn \rceil-1 ⌈logn⌉−1。综上,可以找到最坏比较次数为 n + ⌈ l o g n ⌉ − 2 n+\lceil logn \rceil-2 n+⌈logn⌉−2的算法寻找到最大值和次大值。
注意的是,这种算法不适用于存在重复元素的情况
代码实现
见 link
#include <bits/stdc++.h>
using namespace std;
const int N = (int)1e5+5;
int arr[N << 1], n = 10000;
struct node {
int _max, _secmax;
void print() {
cout << "Max = " << _max << ' ' << "Second Max = " << _secmax << endl;
}
};
void f1(int arr[], int n, node& ans) {
ans._max = ans._secmax = arr[0];
for (int i = 1; i < n; i++) {
if (ans._max < arr[i]) {
ans._secmax = ans._max;
ans._max = arr[i];
} else if (ans._secmax < arr[i]) {
ans._secmax = arr[i];
}
}
}
void f2(int arr[], int n, node& ans) {
//id = 1 为根
//构造树 (2*n-1-2+1)/2 = n-1
for (int i = 2*n-2; i>=2; i-=2) {
if (arr[i] > arr[i+1]) {
arr[i/2] = arr[i];
} else {
arr[i/2] = arr[i+1];
}
}
ans._max = arr[1];
//少一层logn-1
int start = 2;
if (arr[1] == arr[2]) {
ans._secmax = arr[3];
} else {
start = 3;
ans._secmax = arr[2];
}
for (int i = 2*start; i <= 2*n-2; i*=2) {
if (arr[i] == arr[i/2]) {
ans._secmax = max(ans._secmax, arr[i+1]);
} else {
ans._secmax = max(ans._secmax, arr[i]);
i++;
}
}
}
int main() {
int s, flag;
node s1, s2;
for (int i = 0; i < n; i++) {
do {
s = rand(); flag = 0;
for (int j = 0; j < i; j++) {
if (s == arr[n+j]) {
flag = 1;
break;
}
}
} while (flag);
arr[i+n] = s;
}
f1(arr+n, n, s1);
f2(arr, n, s2);
s1.print();
s2.print();
return 0;
}