排序中的堆排序一直没去看,然后去百度面试问了topN的算法,小数据集。我在写代码的过程中用了STL中的set保存了最大的N个数,然后取得第N+1个数,与set中的第一个数比较,如果大于它,则擦除第一个数,插入第N+1个数。然后面试官说,这个方法肯定不是他想要的。好吧,我猜他是想要我用建堆写代码,没搞定,回来赶紧恶补一下。
简单选择排序没有把前一趟的比较结果保留下来,这样在后一趟选择时,反复对前一趟已经做过的比较又重做了一遍,堆排序就是针对这点对简单选择排序进行了改进。首先,什么是堆?堆是具有下列性质的完全二叉树。
(1)小根堆:每个节点的值<=左右孩子节点的值
(2)大根堆:每个节点的值>=左右孩子节点的值
堆的存储结构:对于一个具有n个记录的堆,可以用如下方法,由数组r[]来存放它:
(1)根节点存放在r[1];
(2)假定节点x存放在r[i],若它有左孩子节点,则其左孩子节点存放在r[2i],如果它有右孩子节点,则其右孩子节点存放在r[2i+1]
建堆的过程其实关键就是堆的调整过程,小根堆的筛选过程是:从最后一个分支节点开始逐个向上筛选,直到根节点结束,这样从最后一棵子树开始使其符合堆的性质,迭代地使整个树符合堆的性质。若堆排序的长度为n,则最后一个分支节点的编号为[n/2]。
堆排序:根据堆的性质,堆的根节点总是堆中的最小元素(小根堆),所以将根节点逐个输出,并令剩下的部分重新恢复堆的性质,这样就可以实现排序。堆排序的具体过程如下:
(1)将待排序的元素构造一个堆
(2)输出堆顶元素
(3)将堆中最后一个元素移至堆顶,直到堆中只有一个元素。
反复执行后两个步骤,直到堆中只有一个元素。
C++程序代码如下:
/*小根堆*/
#include <iostream>
using namespace std;
void HeapSift(int A[], int k, int n) {
int i = k, j = 2*i;
while (j <= n) {
if (j<n && A[j]>A[j+1]) { //筛选的节点
++j;
}
if (A[i] < A[j]) { //符号小根堆的条件,结束
break;
}
else {
swap(A[i], A[j]);
i = j;
j = 2*i;
}
}
}
int main() {
int i;
int n;
cin >> n;
int *f = new int[n+1];
for (i=1; i<=n; ++i) {
cin>>f[i];
}
for (i=n/2; i>=1; --i) { //建堆
HeapSift(f, i, n);
}
for (i=1; i<n; ++i) {
cout << f[1] << " ";
swap(f[1], f[n-i+1]);
HeapSift(f, 1, n-i);
}
cout << f[1];
cout << endl;
return 0;
}
由此可以推断出,topN的算法需要建小根堆,代码如下:
#include <iostream>
using namespace std;
void HeapSort(int f[], int k, int n) {
int i = k, j = 2*i;
while (j<=n) {
if (j<n && f[j]>f[j+1]) {
++j;
}
if (f[i] < f[j]) {
break;
}
swap(f[i], f[j]);
i = j;
j = 2*i;
}
}
void topN(int f[], int res[], int m, int n) {
int i;
for (i=1; i<=n; ++i) {
res[i] = f[i];
}
if (i<=n) {
return;
}
for (i=n/2; i>=1; --i) {
HeapSort(res, i, n);
}
for (i=n+1; i<=m; ++i) {
if (res[1] < f[i]) { //堆顶小于待比较的数
res[1] = f[i];
}
HeapSort(res, 1, n);
}
}
int main() {
int m,n;
cin >> m >> n;
int *f = new int[m+1];
int *res = new int[n+1];
int i;
for (i=1; i<=m; ++i) {
cin >> f[i];
}
topN(f, res, m, n);
for (i=1; i<=n; ++i) {
cout << res[i] << " ";
}
cout << endl;
}