算法六:堆排序

堆排序

堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序。首先简单了解下堆结构。

堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆;或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。如下图:

在这里插入图片描述

同时,我们对堆中的结点按层进行编号,将这种逻辑结构映射到数组中就是下面这个样子

在这里插入图片描述

该数组从逻辑上讲就是一个堆结构,我们用简单的公式来描述一下堆的定义就是:

大顶堆:arr[i] >= arr[2i+1] && arr[i] >= arr[2i+2]

小顶堆:arr[i] <= arr[2i+1] && arr[i] <= arr[2i+2]

ok,了解了这些定义。接下来,我们来看看堆排序的基本思想及基本步骤:

堆排序基本思想及步骤
  堆排序的基本思想是:将待排序序列构造成一个大顶堆,此时,整个序列的最大值就是堆顶的根节点。将其与末尾元素进行交换,此时末尾就为最大值。然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值。如此反复执行,便能得到一个有序序列了

步骤一 构造初始堆。将给定无序序列构造成一个大顶堆(一般升序采用大顶堆,降序采用小顶堆)。

a.假设给定无序序列结构如下

在这里插入图片描述

2.此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点 arr.length/2-1=5/2-1=1,也就是下面的6结点),从左至右,从下至上进行调整。

在这里插入图片描述

4.找到第二个非叶节点4,由于[4,9,8]中9元素最大,4和9交换。
在这里插入图片描述

这时,交换导致了子根[4,5,6]结构混乱,继续调整,[4,5,6]中6最大,交换4和6。

在这里插入图片描述

此时,我们就将一个无需序列构造成了一个大顶堆。

步骤二 将堆顶元素与末尾元素进行交换,使末尾元素最大。然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。

a.将堆顶元素9和末尾元素4进行交换

在这里插入图片描述

b.重新调整结构,使其继续满足堆定义
在这里插入图片描述

c.再将堆顶元素8与末尾元素5进行交换,得到第二大元素8.

在这里插入图片描述

后续过程,继续进行调整,交换,如此反复进行,最终使得整个序列有序

在这里插入图片描述

再简单总结下堆排序的基本思路:

a.将无需序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆;

b.将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;

c.重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。

代码实现

def sift(li, low, high):
    """
    :param li: 列表
    :param low: 堆的根节点位置
    :param high: 堆的最后一个元素的位置
    :return:
    """
    i = low           # i 最开始指向根节点
    j = 2 * i + 1     # 就开始是左孩子
    temp = li[low]    # 把堆顶元素存起来
    while j <= high:  # 只要j位置有数
        if j + 1 <= high and li[j + 1] > li[j]:  # 如果有右孩子并且比较大
            j += 1          # j 指向右孩子
        if li[j] > temp:
            li[i] = li[j]
            i = j          # 往下看一层
            j = 2 * i + 1
        else:              # tmp更大, 把temp放到i的位置上。
            li[i] = temp   # 把temp放到某个合适位置
            break
    else:
        li[i] = temp   # 把temp放到叶子节点上


def heap_sort(li):
    n = len(li)
    for i in range((n -2) // 2, -1, -1):
        # i表示建堆的时候调整的部分的根的下标
        sift(li, i, n-1)
    # 建堆完成
    print(li)
    for i in range(n-1, -1, -1):
        # i 指向当前堆的最后一个元素
        li[0], li[i] = li[i], li[0]
        sift(li, 0, i-1) # i-1是新的high

堆排序–topk问题
解决思路:
1、去列表前k个元素建立一个小根堆,堆顶就是目前第k大的数
2、依次向后遍历原列表,对于列表中的元素,如果小于堆顶,则忽略该元素,如果大于堆顶元素,则将堆顶元素与更换为该元素,并且进行一次调整;
3、遍历列表中的所有元素,倒序弹出堆顶

topk问题代码

def sift(li, low, high):
    """
    :param li: 列表
    :param low: 堆的根节点位置
    :param high: 堆的最后一个元素的位置
    :return:
    """
    i = low           # i 最开始指向根节点
    j = 2 * i + 1     # 就开始是左孩子
    temp = li[low]    # 把堆顶元素存起来
    while j <= high:  # 只要j位置有数
        if j + 1 <= high and li[j + 1] > li[j]:
            j += 1
        if li[j] > temp:
            li[i] = li[j]
            i = j          # 往下看一层
            j = 2 * i + 1
        else:              # tmp更大, 把temp放到i的位置上。
            li[i] = temp   # 把temp放到某个合适位置
            break
    else:
        li[i] = temp   # 把temp放到叶子节点上


def heap_top(li, k):
    # 1、建堆
    heap = li[0: k]
    for i in range((k - 2) // 2, -1, -1):
        sift(heap, i, k-1)
    # 2、遍历
    for i in range(k, len(li) - 1):
        if li[i] > heap[0]:
            heap[0] = li[i]
            sift(heap, 0, k - 1)
    # 3、出数
    for i in range(k-1, -1, -1):
        heap[0],heap[i] = heap[i], heap[0]
        sift(heap, 0, i-1)
    return heap
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值