二叉树---堆及堆排序和TOP-K问题

本文详细介绍了树的概念、结构、表示方法和在文件系统目录树中的应用。接着,深入探讨了二叉树的特性,包括满二叉树和完全二叉树的定义,并给出了二叉树的存储结构,包括顺序存储和链式存储。堆作为特殊的二叉树,分为大堆和小堆,文章阐述了堆的性质、构建方法和删除元素的调整算法。最后,通过堆排序和TOP-K问题展示了堆在排序和数据检索中的应用。
摘要由CSDN通过智能技术生成

1、树的概念及结构

1.1树的概念

  1. 树:树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为****它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的
  • 有一个特殊的结点,称为根结点,根节点没有前驱结点
  • 除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一个集合Ti(1<= i<= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继
  • 树是递归定义的

在这里插入图片描述

ps:树形结构中,子树之间不能有交集(相交),否则就不是树形结构

在这里插入图片描述

  1. 子树是不相交的。
  2. 除了根节点为,每个子节点有且仅有一个父节点
  3. 一颗N个节点的树,有N-1条边。

1.2 树的概念

在这里插入图片描述

  1. 节点的度:一个节点含有的子树的个数称为该节点的度; 如上图:A的为6
  2. 叶节点或终端节点度为0的节点称为叶节点; 如上图:B、C、H、I…等节点为叶节点
  3. 非终端节点或分支节点:度不为0的节点; 如上图:D、E、F、G…等节点为分支节点
  4. 双亲节点或父节点若一个节点含有子节点,则这个节点称为其子节点的父节点; 如上图:A是B的父节点
  5. 孩子节点或子节点一个节点含有的子树的根节点称为该节点的子节点; 如上图:B是A的孩子节点
  6. 兄弟节点:具有相同父节点的节点互称为兄弟节点; 如上图:B、C是兄弟节点
  7. 树的度:一棵树中,最大的节点的度称为树的度; 如上图:树的度为6
  8. 节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推
  9. 树的高度或深度树中节点的最大层次; 如上图:树的高度为4
  10. 堂兄弟节点:双亲在同一层的节点互为堂兄弟;如上图:H、I互为兄弟节点
  11. 节点的祖先:从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先
  12. 子孙:以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙
  13. 森林:由m(m>0)棵互不相交的树的集合称为森林

1.3 树的表示

1.3 树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法

//孩子兄弟表示法
typedef int DataType;
struct Node
{
struct Node* _firstChild1; // 第一个孩子结点
struct Node* _pNextBrother; // 指向其下一个兄弟结点
DataType _data; // 结点中的数据域
};

在这里插入图片描述
在这里插入图片描述


1.4 树在实际中的运用

树应用于"文件系统的目录树结构"

在这里插入图片描述


2. 二叉树概念及结构

2.1 概念

  1. 一棵二叉树是结点的一个有限集合,该集合:
    1.1 可以为空
    1.2 由一个根节点加上两棵别称为左子树和右子树的二叉树组成

在这里插入图片描述

  1. 从图上可以看出:
    2.1 二叉树不存在度大于2的节点
    2.2 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
    ps:对于任意的二叉树都是由以下几种情况复合而成的:

在这里插入图片描述


2.2 现实中的二叉树

  1. 现实中的二叉树
    ps.图里面的二叉树为特殊的二叉树->“满二叉树

在这里插入图片描述
在这里插入图片描述

  1. 当普通人看到这样的数时,会惊叹的说:这树长的真标准(对称)啊,是自然的吗?
    程序员:卧槽,这不是"满二叉树"么…

2.3 特殊的二叉树

  1. 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为K,且结点总数是2k-1 ,则它就是满二叉树
  1. 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。 要注意的是满二叉树是一种特殊的完全二叉树。完全二叉树前k-1行的节点都是满的,最后一层不满,但是从左往右的节点是连续的。

在这里插入图片描述

  1. 满二叉树求节点总数的推导过程:
    等比数列求和公式->a1*(1-qn) / (1-q)
    设二叉树一共为K层
    20+21+22+23+…+2(k-1)
    =1*(1-2k) / (1-2)
    =2k - 1

2.4 二叉树的性质

  1. 若规定根节点的层数为1,则一棵非空二叉树的第i层上最多有2(i-1)个结点.
  2. 若规定根节点的层数为1,则深度为h的二叉树的最大结点数是2h - 1.
  3. 对任何一棵非空二叉树, 如果度为0其叶结点个数为n0度为2的分支结点个数为n2,则有n0 = n2 + 1
  4. 对任何一棵二叉树, 如果度为0其叶结点个数为n0 , 度为2的分支结点个数为n2 ,则有h =long2(n+1).
    (ps:long2(n+1)是以2为底,n + 1的对数)
  5. 对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则对于序号为i的结点有:
  • 若i>0,i位置节点的双亲序号:(i-1)/2;i=0,i为根节点编号,无双亲节点
  • 若2i+1<n,左孩子序号:2i+1,2i+1>=n否则无左孩子
  • 若2i+2<n,右孩子序号:2i+2,2i+2>=n否则无右孩子

在这里插入图片描述


2.5 填空题

  1. 某二叉树共有 399 个结点,其中有 199 个度为 2 的结点,则该二叉树中的叶子结点数为(200
    解释:二叉树的度不超过2,所以除了给出199个度为2的节点,剩下399 - 199 = 200 个度为0的节点

  2. 在具有 2n 个结点的完全二叉树中,叶子结点个数为(n
    推导过程:
    在这里插入图片描述

  3. 一棵完全二叉树的节点数位为531个,那么这棵树的高度为(10
    解释:高度从1开始,根为第一层,第9层为511,所以是10层,或者根据最多节点公式(2k-1)推出最少节点公式(2k-1+1-1),然后把节点数代入公式里面就等于:2k-1 = 531->k = 9->根节点层数从1开始算所以->k = 10层

  4. 一个具有767个节点的完全二叉树,其叶子节点个数为(384
    推导过程:
    在这里插入图片描述


2.6 二叉树的存储结构

二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。

  1. 顺序存储
    顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树
    在这里插入图片描述
  2. 链式结构
    二叉树的链式存储结构是指:用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址 。链式结构又分为二叉链三叉链,我们当前所学习的一般都是二叉链,学到高阶数据结构如红黑树等会用到三叉链。
    在这里插入图片描述
typedef int BTDataType;
//二叉链
struct BinaryTreeNode
{
   struct BinTreeNode* _pLeft; // 指向当前节点左孩子
   struct BinTreeNode* _pRight; // 指向当前节点右孩子
   BTDataType _data; // 当前节点值域
}

//三叉链
struct BinaryTreeNode
{
struct BinTreeNode* _pParent; // 指向当前节点的双亲
struct BinTreeNode* _pLeft; // 指向当前节点左孩子
struct BinTreeNode* _pRight; // 指向当前节点右孩子
BTDataType _data; // 当前节点值域
}

3. 二叉树的顺序结构及实现

3.1 二叉树的顺序结构

  1. 普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段

在这里插入图片描述


3.2 堆的概念及结构

  1. 如果有一个关键码的集合K = { k0,k1 ,k2 ,…,kn-1 },把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中,并满足:ki <=k2*i+1 且 ki<= ( k2*i+1>=且>=k2*i+2 ) i = 0,1,2…,则称为小堆(或大堆)将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。
    2.1、形象的说就是:
    大堆/大根堆->树种父节点都大于或等于(>=)子节点
    小堆/小根堆->树种父节点都小于或等于(>=)子节点

    ps:用于解决"堆排序和topk问题"…
  2. 堆的性质
  • 堆中某个节点的值总是不大于或不小于其父节点的值
  • 堆总是一棵完全二叉树
    在这里插入图片描述

3.2 堆的实现

使用数组实现堆
头文件------>Heap.h

#ifndef HEAP_H_
#define HEAP_H_

#include <stdio.h>
#include <stdlib.h>
#include <stdbool.h>
#include <assert.h>

typedef int HPDataType;

typedef struct Heap
{
    HPDataType* p;
    size_t size;
    size_t capacity;
} HP;

void HeapInit(HP* hp);                     //初始化堆
void HeapDestory(HP* hp);                  //释放堆
void HeapPrint(HP* hp);                    //显示堆数据
void Swap(HPDataType* a1, HPDataType* a2); //交换二个节点的内容
void HeapPush(HP* hp, HPDataType x);       //插入数据,并且控制保持是堆(向上调整)
void HeapPop(HP* hp);                      //删除根节点,并且控制保持是堆(向下调整)
bool HeapEmpty(HP* hp);                    //判断堆是否为空
size_t HeapSize(HP* hp);                   //堆的有效数据的数量
size_t HeapTop(HP* hp);                    //根的数据

#endif

函数实现源文件:Heap.c
#include “Heap.h”

HeapInit->初始化堆接口

void HeapInit(HP* hp)
{
    assert(hp);

    hp->p = NULL;
    hp->size = 0;
    hp->capacity = 0;
}

HeapDestory->释放堆接口

void HeapDestory(HP* hp)
{
    assert(hp);
    free(hp->p);
    hp->p = NULL;
    hp->size = 0;
    hp->capacity = 0;
}

HeapPrint->显示堆数据接口

void HeapPrint(HP* hp)
{
    assert(hp);

    for (size_t i = 0; i < hp->size; ++i)
    {
        printf("%d ", hp->p[i]);
    }
    printf("\n");
}

Sweap->用于交换二个节点(下标)中的数据

void Swap(HPDataType* a1, HPDataType* a2)
{
    HPDataType tmp = *a1;
    *a1 = *a2;
    *a2 = tmp;
}

3.2.1 堆向上调整算法

HeapPush->尾(最后一个节点)插新元素(节点),并且控制保持是堆(向上调整)

//向上调整函数接口
void AdHeapUp(HPDataType* a, size_t child)
{
    //父节点的下标
    size_t parent = (child - 1) / 2;
    //当向上调整到根节点(第一层的节点)时,说明调整完毕,退出循环
    while (child > 0)
    {
        //当孩子节点小于父节点时进行调整,说明这是一个"小堆"->根节点存储最小的节点
        //当孩子节点大于父节点时进行调整,说明这是一个"大堆"->根节点存储最大的节点
        // if (a[child] > a[parent])    //大堆
        if (a[child] < a[parent])      //小堆
        {
            //交换节点数据,并且继续往下调整
            Swap(&a[child], &a[parent]);
            //更新子节点和父节点
            child = parent;
            parent = (child - 1) / 2;
        }
        else
        {
            //可能中间就调整完成,跳出循环
            break;
        }
    }
}

void HeapPush(HP* hp, HPDataType x)
{
    assert(hp);

    //判断容量是否已满,满了扩容->基本操作
    if (hp->size == hp->capacity)
    {
        size_t newCapacity = hp->capacity == 0 ? 4 : hp->capacity * 2;
        HPDataType* sp = (HPDataType*)realloc(hp->p, sizeof(HPDataType) * newCapacity);
        //判空
        if (sp == NULL)
        {
            printf("realloc fail!!!\n");
            exit(EXIT_FAILURE);
        }
        hp->p = sp;
        hp->capacity = newCapacity;
    }

    //插入数据
    hp->p[hp->size] = x;
    ++hp->size;

    //向上调整,控制保持是一个小堆/大堆
    AdHeapUp(hp->p, hp->size - 1);
}

图解:
在这里插入图片描述

3.2.2 堆向下调整算法

  1. 现在我们给出一个数组,逻辑上看做一颗完全二叉树。我们通过从根节点开始的向下调整算法可以把它调整成一个小堆。向下调整算法有一个前提:左右子树必须是一个堆,才能调整。
    int array[] = {27,15,19,18,28,34,65,49,25,37};

在这里插入图片描述

  1. HeapPop->删除根节点(下标)数据,并且控制保持是堆(向下调整)
//向下调整函数接口
void AdJustDown(HPDataType* a, size_t root, size_t size)
{
    size_t parent = root;
    //左孩子下标位置
    size_t child = (parent * 2) + 1;

    //孩子节点大于最大节点时,就说明向下调整完毕,退出循环
    while (child < size)
    {
        //选出左右孩子中最小/大的那个->"小/大堆"
        //如果右孩子(a[child + 1])小于左孩子(a[child])
        //则最小的孩子是右孩子,自增一下左孩子下标就是右孩子了
        //if (a[child + 1] > a[child] && child + 1 < size) //大堆
        if (a[child + 1] < a[child] && child + 1 < size)   //小堆
        {
            ++child;
        }

        //当孩子节点小于父节点时进行调整,说明这是一个"小堆"->根节点存储最小的节点
        //当孩子节点大于父节点时进行调整,说明这是一个"大堆"->根节点存储最大的节点
        if (a[child] < a[parent])
        {
            //交换节点数据,并且继续往下调整
            Swap(&a[child], &a[parent]);
            //更新父节点下标和孩子节点下标
            parent = child;
            child = (parent * 2) + 1;
        }
        else
        {
            break;
        }
    }
}

//删除堆顶数据(最小/最大值)
void HeapPop(HP* hp)
{
    assert(hp);
    assert(hp->size > 0);

    //首先交换根节点和最后一个节点的数据
    Swap(&hp->p[0], &hp->p[hp->size - 1]);
    //除最后一个节点数据
    --hp->size;

    //向下调整堆
    AdJustDown(hp->p, 0, hp->size);
}

HeapEmpty->判断堆是否为NULL

bool HeapEmpty(HP* hp)
{
    assert(hp);
    return hp->size == 0;
}

HeapSize->堆中的有效数据的数量

size_t HeapSize(HP* hp)
{
    assert(hp);
    assert(hp->size > 0);
    return hp->size;
}

HeapTop->取堆顶(根节点下标)的数据->取最大/最小值

size_t HeapTop(HP* hp)
{
    assert(hp);
    assert(hp->size > 0);

    return hp->p[0];
}

3.2.3 完整堆实现代码

Heap.h

#ifndef HEAP_H_
#define HEAP_H_

#include <stdio.h>
#include <stdlib.h>
#include <stdbool.h>
#include <assert.h>

typedef int HPDataType;

typedef struct Heap
{
    HPDataType* p;
    size_t size;
    size_t capacity;
} HP;

void HeapInit(HP* hp);                     //初始化
void HeapDestory(HP* hp);                  //释放堆
void HeapPrint(HP* hp);                    //显示堆数据
void Swap(HPDataType* a1, HPDataType* a2); //交换二个节点的内容
void HeapPush(HP* hp, HPDataType x);       //插入数据,并且控制保持是堆(向上调整)
void HeapPop(HP* hp);                      //删除根节点,并且控制保持是堆(向下调整)
bool HeapEmpty(HP* hp);                    //判断堆是否为空
size_t HeapSize(HP* hp);                   //堆的有效数据的数量
size_t HeapTop(HP* hp);                    //根的数据

#endif


Heap.c
#include "Heap.h"

void HeapInit(HP* hp)
{
    assert(hp);

    hp->p = NULL;
    hp->size = 0;
    hp->capacity = 0;
}

void HeapDestory(HP* hp)
{
    assert(hp);
    free(hp->p);
    hp->p = NULL;
    hp->size = 0;
    hp->capacity = 0;
}

void HeapPrint(HP* hp)
{
    assert(hp);

    for (size_t i = 0; i < hp->size; ++i)
    {
        printf("%d ", hp->p[i]);
    }
    printf("\n");
}

void Swap(HPDataType* a1, HPDataType* a2)
{
    HPDataType tmp = *a1;
    *a1 = *a2;
    *a2 = tmp;
}

void AdHeapUp(HPDataType* a, size_t child)
{
    //求父节点的下标
    size_t parent = (child - 1) / 2;
    //当向上调整到根节点([0])时,退出循环
    while (child > 0)
    {
        //当孩子节点小于父节点时进行调整,说明这是一个"小堆"->根节点存储最小的节点
        //当孩子节点大于父节点时进行调整,说明这是一个"大堆"->根节点存储最大的节点
        // if (a[child] > a[parent])    //大堆
        if (a[child] < a[parent])      //小堆
        {
            Swap(&a[child], &a[parent]);
            //更新子节点和父节点
            child = parent;
            parent = (child - 1) / 2;
        }
        else
        {
            //不符合条件就说明调整完毕,直接跳出循环
            break;
        }
    }
}

void HeapPush(HP* hp, HPDataType x)
{
    assert(hp);

    //判断容量是否已满,满了扩容
    if (hp->size == hp->capacity)
    {
        size_t newCapacity = hp->capacity == 0 ? 4 : hp->capacity * 2;
        HPDataType* sp = (HPDataType*)realloc(hp->p, sizeof(HPDataType) * newCapacity);
        //判空
        if (sp == NULL)
        {
            printf("realloc fail!!!\n");
            exit(EXIT_FAILURE);
        }
        hp->p = sp;
        hp->capacity = newCapacity;
    }

    //插入数据
    hp->p[hp->size] = x;
    ++hp->size;

    //向上调整,控制保持是一个小堆
    AdHeapUp(hp->p, hp->size - 1);
}

void AdJustDown(HPDataType* a, size_t root, size_t size)
{
    size_t parent = root;
    //左孩子节点的下标
    size_t child = (parent * 2) + 1;

    //孩子节点大于最大节点时就说明调整完毕,退出循环
    while (child < size)
    {
        //选出左右孩子中最小的那个
        if (a[child + 1] < a[child] && child + 1 < size)
        {
            ++child;
        }

        //判断孩子节点和父节点->小于的话是"小堆",大于的话是"大堆"
        if (a[child] < a[parent])
        {
            //交换节点数据,并且继续往下调整
            Swap(&a[child], &a[parent]);
            //更新父节点和孩子节点
            parent = child;
            child = (parent * 2) + 1;
        }
        else
        {
            break;
        }
    }
}

//删除堆顶数据(最小/最大)
void HeapPop(HP* hp)
{
    assert(hp);
    assert(hp->size > 0);

    //首先交换根节点和最后一个节点的数据
    Swap(&hp->p[0], &hp->p[hp->size - 1]);
    //除最后一个节点数据
    --hp->size;

    //向下调整堆
    AdJustDown(hp->p, 0, hp->size);
}

bool HeapEmpty(HP* hp)
{
    assert(hp);
    return hp->size == 0;
}

size_t HeapSize(HP* hp)
{
    assert(hp);
    assert(hp->size > 0);
    return hp->size;
}

size_t HeapTop(HP* hp)
{
    assert(hp);
    assert(hp->size > 0);

    return hp->p[0];
}

Test.c
#include "Heap.h"

void HeapSort(int* p, int size)
{
    HP hp;
    HeapInit(&hp);
    //数组数据入堆
    for (int i = 0; i < size; ++i)
    {
        HeapPush(&hp, p[i]);
    }
    //进行排序
    size_t j = 0;
    while (!HeapEmpty(&hp))
    {
        p[j] = HeapTop(&hp);
        ++j;
        HeapPop(&hp);
    }
}

int main()
{
    int Array[] = { 1, 8, 4, 6, 5, 7, 9, 0, 2, 3 };
    //"劣版堆排序"
    HeapSort(Array, sizeof(Array) / sizeof(Array[0]));
    for (int i = 0; i < sizeof(Array) / sizeof(Array[0]); ++i)
    {
        printf("%d ", Array[i]);
    }
    printf("\n");
    system("pause");
}

测试代码里面的堆排序是劣版的,时间复杂度0(nlongN) 空间复杂度0(N)


4、 堆的应用

4.1 堆排序

  1. 堆排序即利用堆的思想来进行排序,总共分为两个步骤:
    1.1、建堆
  • 升序,建大堆
  • 降序,建小堆
  1. 利用堆删除思想来进行排序

4.1.1 向下调整算法建大/小堆

  1. 升序,建大堆
    ps:不管是建大堆还是小堆,最好使用向下调整算法(时间复杂度:O(N)),因为它比向上调整算法(时间复杂度:O(nlongN))建堆更优
void AdJustDown(HPDataType* a, size_t root, size_t size)
{
    size_t parent = root;
    //左孩子下标位置
    size_t child = (parent * 2) + 1;

    //孩子节点大于最大节点时,就说明向下调整完毕,退出循环
    while (child < size)
    {
        //选出左右孩子中最小/大的那个->"小/大堆"
        //如果右孩子(a[child + 1])小于左孩子(a[child])
        //则最小的孩子是右孩子,自增一下左孩子下标就是右孩子了
        if (a[child + 1] > a[child] && child + 1 < size) //大堆
        //if (a[child + 1] < a[child] && child + 1 < size)   //小堆
        {
            ++child;
        }

        //当孩子节点小于父节点时进行调整,说明这是一个"小堆"->根节点存储最小的节点
        //当孩子节点大于父节点时进行调整,说明这是一个"大堆"->根节点存储最大的节点
        //if (a[child] < a[parent]) //小堆
        if (a[child] > a[parent]) //大堆
        {
            //交换节点数据,并且继续往下调整
            Swap(&a[child], &a[parent]);
            //更新父节点下标和孩子节点下标
            parent = child;
            child = (parent * 2) + 1;
        }
        else
        {
            break;
        }
    }
}

void HeapSort(int* a, size_t n)
{
    //排升序,建"大堆"(调用向下调整函数接口)
    for(int i = (n - 1 - 1) / 2; i >= 0; --i)
    {
        AdJustDown(a, i, n);
    }

}

int main()
{
    int Array[] = { 1, 8, 4, 6, 5, 7, 9, 0, 2, 3 };
    //堆排序
    HeapSort(Array, sizeof(Array) / sizeof(Array[0]));
    for (int i = 0; i < sizeof(Array) / sizeof(Array[0]); ++i)
    {
        printf("%d ", Array[i]);
    }
    printf("\n");
}

图解:

在这里插入图片描述


4.1.2 向上调整算法建大/小堆

  1. 降序,建小堆
    ps:不管是建大堆还是小堆,最好使用向下调整算法(时间复杂度:O(N)),因为它比向上调整算法(时间复杂度:O(nlongN))建堆更优
void AdJustDown(HPDataType* a, size_t root, size_t size)
{
    size_t parent = root;
    //左孩子下标位置
    size_t child = (parent * 2) + 1;

    //孩子节点大于最大节点时,就说明向下调整完毕,退出循环
    while (child < size)
    {
        //选出左右孩子中最小/大的那个->"小/大堆"
        //如果右孩子(a[child + 1])小于左孩子(a[child])
        //则最小的孩子是右孩子,自增一下左孩子下标就是右孩子了
        //if (a[child + 1] > a[child] && child + 1 < size) //大堆
        if (a[child + 1] < a[child] && child + 1 < size)   //小堆
        {
            ++child;
        }

        //当孩子节点小于父节点时进行调整,说明这是一个"小堆"->根节点存储最小的节点
        //当孩子节点大于父节点时进行调整,说明这是一个"大堆"->根节点存储最大的节点
        if (a[child] < a[parent]) //小堆
        //if (a[child] > a[parent]) //大堆
        {
            //交换节点数据,并且继续往下调整
            Swap(&a[child], &a[parent]);
            //更新父节点下标和孩子节点下标
            parent = child;
            child = (parent * 2) + 1;
        }
        else
        {
            break;
        }
    }
}

void HeapSort(int* a, size_t n)
{
    //排降序,建"小堆"(调用向下调整函数接口)

    for(int i = (n - 1 - 1) / 2; i >= 0; --i)
    {
        AdJustDown(a, i, n);
    }

}

int main()
{
    int Array[] = { 1, 8, 4, 6, 5, 7, 9, 0, 2, 3 };
    //堆排序
    HeapSort(Array, sizeof(Array) / sizeof(Array[0]));
    for (int i = 0; i < sizeof(Array) / sizeof(Array[0]); ++i)
    {
        printf("%d ", Array[i]);
    }
    printf("\n");
    system("pause");
}

图解:

在这里插入图片描述

使用向上调整算法建数组跟建堆相似…这里就不画图解了

void AdHeapUp(HPDataType* a, size_t child)
{
    //求父节点的下标
    size_t parent = (child - 1) / 2;
    //当向上调整到根节点([0])时,退出循环
    while (child > 0)
    {
        //当孩子节点小于父节点时进行调整,说明这是一个"小堆"->根节点存储最小的节点
        //当孩子节点大于父节点时进行调整,说明这是一个"大堆"->根节点存储最大的节点
        if (a[child] > a[parent])    //大堆
        //if (a[child] < a[parent])      //小堆
        {
            Swap(&a[child], &a[parent]);
            //更新子节点和父节点
            child = parent;
            parent = (child - 1) / 2;
        }
        else
        {
            //不符合条件就说明调整完毕,直接跳出循环
            break;
        }
    }
}

void HeapSort(int* a, size_t n)
{
    //排降序,建"大堆"(调用向上调整函数接口)
    for (int i = 1; i < n; ++i)
    {
        AdHeapUp(a, i);
    }
}

int main()
{
    int Array[] = { 1, 8, 4, 6, 5, 7, 9, 0, 2, 3 };
    //堆排序
    HeapSort(Array, sizeof(Array) / sizeof(Array[0]));
    for (int i = 0; i < sizeof(Array) / sizeof(Array[0]); ++i)
    {
        printf("%d ", Array[i]);
    }
    printf("\n");
}

4.1.3 利用堆删除思想来进行排序

  1. 利用堆删除思想来进行排序
    建堆和堆删除中都用到了向下调整,因此掌握了向下调整,就可以完成堆排序
size_t end = n - 1;
    while (end > 0)
    {
        Swap(&a[0], &a[end]);
        AdJustDown(a, 0, end);
        --end;

在这里插入图片描述


4.1.4 完整堆排序代码

  1. 这里排的是升序->建"大堆“”
  2. 降序改一下向下调整算法就行了->建"小堆"
 void AdJustDown(HPDataType* a, size_t root, size_t size)
{
    size_t parent = root;
    //左孩子下标位置
    size_t child = (parent * 2) + 1;

    //孩子节点大于最大节点时,就说明向下调整完毕,退出循环
    while (child < size)
    {
        //选出左右孩子中最小/大的那个->"小/大堆"
        //如果右孩子(a[child + 1])小于左孩子(a[child])
        //则最小的孩子是右孩子,自增一下左孩子下标就是右孩子了
        if (a[child + 1] > a[child] && child + 1 < size) //大堆
        //if (a[child + 1] < a[child] && child + 1 < size)   //小堆
        {
            ++child;
        }

        //当孩子节点小于父节点时进行调整,说明这是一个"小堆"->根节点存储最小的节点
        //当孩子节点大于父节点时进行调整,说明这是一个"大堆"->根节点存储最大的节点
        //if (a[child] < a[parent]) //小堆
        if (a[child] > a[parent]) //大堆
        {
            //交换节点数据,并且继续往下调整
            Swap(&a[child], &a[parent]);
            //更新父节点下标和孩子节点下标
            parent = child;
            child = (parent * 2) + 1;
        }
        else
        {
            break;
        }
    }
}

for (int i = (n - 1 - 1) / 2; i >= 0; --i)
    {
        AdJustDown(a, i, n);
    }

    size_t end = n - 1;
    while (end > 0)
    {
        Swap(&a[0], &a[end]);
        AdJustDown(a, 0, end);
        --end;
    }

4.2 建堆的时间复杂度

  1. 因为堆是完全二叉树,而满二叉树也是完全二叉树,此处为了简化使用满二叉树来证明(时间复杂度本来看的就是近似值,多几个节点不影响最终结果):
    在这里插入图片描述 所以:建堆的时间复杂度为O(N)->向下调整算法

向下调整算法建堆的时间复杂度为:O(nlongN)
在这里插入图片描述


4.3 TOP-K问题

  1. TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
    比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
  1. 对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都不能一下子全部加载到内中)。
    最佳的方式就是用堆来解决,基本思路如下:
    2.1、用数据集合中前K个元素来建堆
  • 前k个最大的元素,则建小堆
  • 前k个最小的元素,则建大堆
    2.2、用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素
    在这里插入图片描述
  1. 实现:
void AdJustDown(HPDataType *a, size_t root, size_t size)
{
    size_t parent = root;
    //左孩子下标位置
    size_t child = (parent * 2) + 1;

    //孩子节点大于最大节点时,就说明向下调整完毕,退出循环
    while (child < size)
    {
        //选出左右孩子中最小/大的那个->"小/大堆"
        //如果右孩子(a[child + 1])小于左孩子(a[child])
        //则最小的孩子是右孩子,自增一下左孩子下标就是右孩子了
        // if (a[child + 1] > a[child] && child + 1 < size) //大堆
        if (a[child + 1] < a[child] && child + 1 < size) //小堆
        {
            ++child;
        }

        //当孩子节点小于父节点时进行调整,说明这是一个"小堆"->根节点存储最小的节点
        //当孩子节点大于父节点时进行调整,说明这是一个"大堆"->根节点存储最大的节点
        if (a[child] < a[parent]) //小堆
        // if (a[child] > a[parent]) //大堆
        {
            //交换节点数据,并且继续往下调整
            Swap(&a[child], &a[parent]);
            //更新父节点下标和孩子节点下标
            parent = child;
            child = (parent * 2) + 1;
        }
        else
        {
            break;
        }
    }
}

// TOP-K问题
void PrintTopK(int *a, int n, int k)
{
    // 1. 建堆--用a中前k个元素建堆
    int *Heap = (int *)malloc(sizeof(int) * k);
    assert(Heap);
    for (int i = 0; i < k; ++i)
    {
        Heap[i] = a[i];
    }
    //建小堆->向下调整
    for (int i = (k - 1 - 1) / 2; i >= 0; --i)
    {
        AdJustDown(a, i, k);
    }

    // 2. 将剩余n-k个元素依次与堆顶元素交换,不满则则替换
    for (int i = k; i < n; ++i)
    {
        if (Heap[0] < a[i])
        {
            Heap[0] = a[i];
            AdJustDown(Heap, 0, k);
        }
    }
    //进行排序
    int end = k - 1;
    while (end > 0)
    {
        Swap(&Heap[0], &Heap[end]);
        AdJustDown(Heap, 0, end);
        --end;
    }

    for (int i = 0; i < k; ++i)
    {
        printf("%d ", Heap[i]);
    }
    printf("\n");
}
void TestTopk()
{
    int n = 10000;
    int *a = (int *)malloc(sizeof(int) * n);
    srand(time(0));
    for (size_t i = 0; i < n; ++i)
    {
        a[i] = rand() % 1000000;
    }
    a[5] = 1000000 + 1;
    a[1231] = 1000000 + 2;
    a[531] = 1000000 + 3;
    a[5121] = 1000000 + 4;
    a[115] = 1000000 + 5;
    a[2335] = 1000000 + 6;
    a[9999] = 1000000 + 7;
    a[76] = 1000000 + 8;
    a[423] = 1000000 + 9;
    a[3144] = 1000000 + 10;
    //排序前十个最大的数
    PrintTopK(a, n, 10);
}

int main()
{
    TestTopk();
    system("pause");
    return 0;
}

这次的知识都写完了,有错误请指出,感谢支持!!!

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值