[整理]数据结构-----堆

最新推荐文章于 2022-10-07 15:52:34 发布

wangwenwen

最新推荐文章于 2022-10-07 15:52:34 发布

阅读量737

点赞数

分类专栏：数据结构与算法

数据结构与算法专栏收录该内容

18 篇文章 1 订阅

订阅专栏

一、堆的定义

堆的定义是：n个元素的序列{k₁,k₂,…,k_n}，当且仅当满足如下关系时被成为堆

　　　(1)K_i <= k_2i且 k_i <= k_2i-1

　　或 (2) K_i >= k_2i且 k_i >= k_2i-1

　　　　　　　　　　(i = 1,2,…[n/2])

当满足(1)时，为最小堆，当满足(2)时，为最大堆。

最大堆和最小堆的例子：

堆常用来实现优先队列，在这种队列中，待删除的元素为优先级最高（最低）的那个。在任何时候，任意优先元素都是可以插入到队列中去的，是计算机科学中一类特殊的数据结构的统称

二、STL 中与heap 有关的操作

make_heap(), pop_heap(), push_heap(), sort_heap(), is_heap;

is_heap() :

原型如下 :

bool is_heap(iterator start, iterator end);

->判断迭代器[start, end]区间类的元素是否构成一个堆. 是返回true,否则返回false.

bool is_heap(iterator start, iterator end, StrictWeakOrdering cmp);

->判断迭代器[start, end]区间类的元素在cmp条件下是否构成一个堆.是返回true ,否则返回 false.

make_heap() :

原型如下 :

void make_heap( random_access_iterator start, random_access_iterator end );

void make_heap( random_access_iterator start, random_access_iterator end, StrictWeakOrdering cmp );

->以迭代器[start , end]区间内的元素生成一个堆. 默认使用元素类型的<（即less<type>）操作符进行判断堆的类型, 因此生成的是大顶堆，即vector是从小到大排序.

->当使用了版本2时, 系统使用用户定义的cmp函数来构建一个堆。对type类型，可以在第三个参数传入greater<type>()得到最小堆。

->值得注意的是, make_heap改变了迭代器所指向容器的值.

pop_heap() :

要先调用pop_heap()再在容器中删除数据

原型如下 :

void pop_heap( random_access_iterator start, random_access_iterator end );

void pop_heap( random_access_iterator start, random_access_iterator end, StrictWeakOrdering cmp);

->pop_heap() 并不是真的把最大（最小）的元素从堆中弹出来.而是重新排序堆.它把首元素和末元素交换，然后将[first,last-1)的数据再做成一个堆。

此时, 原来的首元素位于迭代器end-1 的位置,它已不再属于堆的一员!

->如果使用了版本2 , 在交换了首元素和末元素后 ,使用 cmp规则重新构建一个堆.

push_heap() :

要先在容器中加入数据，再调用push_heap ()

原型如下 :

void push_heap( random_access_iterator start, random_access_iterator end );

void push_heap( random_access_iterator start, random_access_iterator end, StrictWeakOrdering cmp);

-> 算法假设迭代器区间[start, end-1)内的元素已经是一个有效堆,然后把end-1 迭代器所指元素加入堆，接着再调整堆，使其满足堆的特性.

-> 如果使用了 cmp 参数, 将使用 cmp 规则构建堆.

sort_heap() :

原型如下 :

void sort_heap (random_access_iterator start, random_access_iterator end);

void sort_heap (random_access_iterator start, random_access_iterator end, StrictWeakOrdering cmp);

-> 堆结构被完全破坏, 相当于对元素进行排序, 效果和排序算法类似.

-> 如果使用了 cmp 参数, 将使用 cmp 规则排序堆.

三、堆的应用

1.堆排序

堆排序(HeapSort)是一树形选择排序。
　堆排序的特点是：在排序过程中，将R[l..n]看成是一棵完全二叉树的顺序存储结构，利用完全二叉树中双亲结点和孩子结点之间的内在关系【参见二叉树的顺序存储结构】，在当前无序区中选择关键字最大(或最小)的记录。

优点直接选择排序中，为了从R[1..n]中选出关键字最小的记录，必须进行n-1次比较，然后在R[2..n]中选出关键字最小的记录，又需要做n-2次比较。事实上，后面的n-2次比较中，有许多比较可能在前面的n-1次比较中已经做过，但由于前一趟排序时未保留这些比较结果，所以后一趟排序时又重复执行了这些比较操作。

　堆排序可通过树形结构保存部分比较结果，可减少比较次数。

堆排序利用了大根堆(或小根堆)堆顶记录的关键字最大(或最小)这一特征，使得在当前无序区中选取最大(或最小)关键字的记录变得简单。

（1）、用大根堆排序的基本思想

· 先将初始文件R[1..n]建成一个大根堆，此堆为初始的无序区

· 再将关键字最大的记录R[1](即堆顶)和无序区的最后一个记录R[n]交换，由此得到新的无序区R[1..n-1]和有序区R[n]，且满足R[1..n-1].keys≤R[n].key

· 由于交换后新的根R[1]可能违反堆性质，故应将当前无序区R[1..n-1]调整为堆。然后再次将R[1..n-1]中关键字最大的记录R[1]和该区间的最后一个记录R[n-1]交换，由此得到新的无序区R[1..n-2]和有序区R[n-1..n]，且仍满足关系R[1..n-2].keys≤R[n-1..n].keys，同样要将R[1..n-2]调整为堆。直到无序区只有一个元素为止。

（2）、大根堆排序算法的基本操作：

· 初始化操作：将R[1..n]构造为初始堆；

· 每一趟排序的基本操作：将当前无序区的堆顶记录R[1]和该区间的最后一个记录交换，然后将新的无序区调整为堆(亦称重建堆)。

注意：

· 只需做n-1趟排序，选出较大的n-1个关键字即可以使得文件递增有序。

· 用小根堆排序与利用大根堆类似，只不过其排序结果是递减有序的。堆排序和直接选择排序相反：在任何时刻，堆排序中无序区总是在有序区之前，且有序区是在原向量的尾部由后往前逐步扩大至整个向量为止。

 
//堆排序
template <class T>
void Sort::HeapSort(T arr[], int len){
	int i; 
	
	//建立子堆 
	for(i = len / 2; i >= 1; i--){
		CreateHeap(arr, i, len);
	}
	
	for(i = len - 1; i >= 1; i--){
		buff = arr[1];
		arr[1] = arr[i + 1];
		arr[i + 1] = buff; 
		
		CreateHeap(arr, 1, i); 
	}
} 


//建立堆 
template <class T>
void Sort::CreateHeap(T arr[], int root, int len){
	int j = 2 * root; 					//root's left child, right (2 * root + 1) 
	T temp = arr[root];
	bool flags = false; 
	
	while(j <= len && !flags){
		if(j < len){
			if(arr[j] < arr[j + 1]){		// Left child is less then right child 
				++j; 				// Move the index to the right child 
			}	
		}
		
		if(temp < arr[j]){
			arr[j / 2] = arr[j];
			j *= 2; 
		}else{
			flags = true; 
		} 
	} 
 	arr[j / 2]  = temp; 
}

2.选择前k个最大（最小）的数

思想：在一个很大的无序数组里面选择前k个最大（最小）的数据，最直观的做法是把数组里面的数据全部排好序，然后输出前面最大（最小）的k个数据。但是，排序最好需要O(nlogn)的时间，而且我们不需要后k个最大（最小）的元素是有序的。这个时候我们可以建立k个元素的最小堆(得出前k个最大值)或者最大堆(得到前k个最小值)，我们只需要遍历一遍数组，在把元素插入到堆中去只需要logk的时间，这个速度是很乐观的。利用堆得出前k个最大（最小）元素特别适合海量数据的处理。

typedef multiset<int, greater<int> >            intSet;
typedef multiset<int, greater<int> >::iterator  setIterator;

void GetLeastNumbers(const vector<int>& data, intSet& leastNumbers, int k)
{
    leastNumbers.clear();

    if(k < 1 || data.size() < k)
        return;

    vector<int>::const_iterator iter = data.begin();
    for(; iter != data.end(); ++ iter)
    {
        if((leastNumbers.size()) < k)
            leastNumbers.insert(*iter);

        else
        {
            setIterator iterGreatest = leastNumbers.begin();

            if(*iter < *(leastNumbers.begin()))
            {
                leastNumbers.erase(iterGreatest);
                leastNumbers.insert(*iter);
            }
        }
    }
}

wangwenwen

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[整理]数据结构-----堆

一、堆的定义堆的定义是：n个元素的序列{k1,k2,…,kn}，当且仅当满足如下关系时被成为堆　　　(1)Ki 2i且 ki 2i-1 　　或 (2) Ki >= k2i且 ki >= k2i-1 　　　　　　　　　　(i = 1,2,…[n/2])当满足(1)时，为最小堆，当满足(2)时，为最大堆。最大堆和最小堆的例子：堆常用来实现优先队
复制链接

扫一扫

专栏目录