排序算法(三)之堆排序

堆排序

  堆排序是利用这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序。首先简单了解下堆结构。

  堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆;或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。如下图:

最大堆的特性如下:

  1. 父结点的键值总是大于或者等于任何一个子节点的键值
  2. 每个结点的左子树和右子树都是一个最大堆

最小堆的特性如下:

  1. 父结点的键值总是小于或者等于任何一个子节点的键值
  2. 每个结点的左子树和右子树都是一个最小堆

同时,我们对堆中的结点按层进行编号,将这种逻辑结构映射到数组中就是下面这个样子

该数组从逻辑上讲就是一个堆结构,我们用简单的公式来描述一下堆的定义就是:

大顶堆:arr[i] >= arr[2i+1] && arr[i] >= arr[2i+2]  

小顶堆:arr[i] <= arr[2i+1] && arr[i] <= arr[2i+2]  

ok,了解了这些定义。接下来,我们来看看堆排序的基本思想及基本步骤:

堆排序基本思想及步骤

  堆排序的基本思想是:将待排序序列构造成一个大顶堆,此时,整个序列的最大值就是堆顶的根节点。将其与末尾元素进行交换,此时末尾就为最大值。然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值。如此反复执行,便能得到一个有序序列了

步骤一 构造初始堆。将给定无序序列构造成一个大顶堆(一般升序采用大顶堆,降序采用小顶堆)。

  a.假设给定无序序列结构如下

2.此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点 arr.length/2-1=5/2-1=1,也就是下面的6结点),从左至右,从下至上进行调整。

4.找到第二个非叶节点4,由于[4,9,8]中9元素最大,4和9交换。

这时,交换导致了子根[4,5,6]结构混乱,继续调整,[4,5,6]中6最大,交换4和6。

此时,我们就将一个无需序列构造成了一个大顶堆。

步骤二 将堆顶元素与末尾元素进行交换,使末尾元素最大。然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。

a.将堆顶元素9和末尾元素4进行交换

b.重新调整结构,使其继续满足堆定义

c.再将堆顶元素8与末尾元素5进行交换,得到第二大元素8.

后续过程,继续进行调整,交换,如此反复进行,最终使得整个序列有序

再简单总结下堆排序的基本思路:

  a.将无需序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆;

  b.将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;

  c.重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。

堆排序是一种选择排序,整体主要由构建初始堆+交换堆顶元素和末尾元素并重建堆两部分组成。其中构建初始堆经推导复杂度为O(n),在交换并重建堆的过程中,需交换n-1次,而重建堆的过程中,根据完全二叉树的性质,[log2(n-1),log2(n-2)...1]逐步递减,近似为nlogn。所以堆排序时间复杂度一般认为就是O(nlogn)级。

基于最大堆实现升序排序

 
// 初始化堆
void initHeap(int a[], int len) {
  // 从完全二叉树最后一个非子节点开始
  // 在数组中第一个元素的索引是0
  // 第n个元素的左孩子为2n+1,右孩子为2n+2,
  // 最后一个非子节点位置在(n - 1) / 2
  for (int i = (len - 1) / 2; i >= 0; --i) {
    adjustMaxHeap(a, len, i);
  }
}
 
void adjustMaxHeap(int a[], int len, int parentNodeIndex) {
  // 若只有一个元素,那么只能是堆顶元素,也没有必要再排序了
  if (len <= 1) {
    return;
  }
 
  // 记录比父节点大的左孩子或者右孩子的索引
  int targetIndex = -1;
  
  // 获取左、右孩子的索引
  int leftChildIndex = 2 * parentNodeIndex + 1;
  int rightChildIndex = 2 * parentNodeIndex + 2;
 
  // 没有左孩子
  if (leftChildIndex >= len) {
    return;
  }
  
  // 有左孩子,但是没有右孩子
  if (rightChildIndex >= len) {
    targetIndex = leftChildIndex;
  }
  // 有左孩子和右孩子
  else {
    // 取左、右孩子两者中最大的一个
    targetIndex = a[leftChildIndex] > a[rightChildIndex] ? leftChildIndex : rightChildIndex;
  }
  
  // 只有孩子比父节点的值还要大,才需要交换
  if (a[targetIndex] > a[parentNodeIndex]) {
    int temp = a[targetIndex];
    
    a[targetIndex] = a[parentNodeIndex];
    a[parentNodeIndex] = temp;
    
    
    // 交换完成后,有可能会导致a[targetIndex]结点所形成的子树不满足堆的条件,
    // 若不满足堆的条件,则调整之使之也成为堆
    adjustMaxHeap(a, len, targetIndex);
  }
}
 
void heapSort(int a[], int len) {
  if (len <= 1) {
    return;
  }
  
  // 初始堆成无序最大堆
  initHeap(a, len);
  
  for (int i = len - 1; i > 0; --i) {
    // 将当前堆顶元素与最后一个元素交换,保证这一趟所查找到的堆顶元素与最后一个元素交换
    // 注意:这里所说的最后不是a[len - 1],而是每一趟的范围中最后一个元素
    // 为什么要加上>0判断?每次不是说堆顶一定是最大值吗?没错,每一趟调整后,堆顶是最大值的
    // 但是,由于len的范围不断地缩小,导致某些特殊的序列出现异常
    // 比如说,5, 3, 8, 6, 4序列,当调整i=1时,已经调整为3,4,5,6,8序列,已经有序了
    // 但是导致了a[i]与a[0]交换,由于变成了4,3,5,6,8反而变成无序了!
    if (a[0] > a[i]) {
      int temp = a[0];
      a[0] = a[i];
      a[i] = temp;
    }
    
    // 范围变成为:
    // 0...len-1
    // 0...len-1-1
    // 0...1 // 结束
    // 其中,0是堆顶,每次都是找出在指定的范围内比堆顶还大的元素,然后与堆顶元素交换
    adjustMaxHeap(a, i - 1, 0);
  }
}
 

转载:https://www.cnblogs.com/chengxiao/p/6129630.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值