一.二叉树的概念和结构
. 一棵二叉树是一格有限个节点的集合,或者为空,或者由根节点和其左子树和右子树组成。
1.空树
.空树是指一个不包含任何节点的树结构,也就是说它没有任何分支和叶子节点。
2.普通二叉树
注:①不存在度为2的节点;
②左右子树不可颠倒顺序,因此二叉树是有序树。
3.满二叉树和完全二叉树
①满二叉树,该树的每一层的节点数都达到了最大值,若一棵树的层数为k,则该二叉树的总节点数为2^k-1个。
②完全二叉树,假设该树有k层,则该树的前k-1层是满的,第k层节点从左到右连续,其第k层最少有一个节点,最多有2^(k-1)个节点,由此看来,满二叉树是一种特殊的完全二叉树。
4.二叉树的性质
1)若规定根节点的层数为1,则一棵非空二叉树的第i层上最多有2^(i-1)个结点.
2)若规定根节点的层数为1,则深度为h的二叉树的最大结点数是2^h-1.
3)对任何一棵二叉树,如果度为0其叶结点个数为n0,度为2的分支结点个数为n2,则有n0=n2+1 4)若规定根节点的层数为1,具有n个结点的满二叉树的深度,h=log2(n+1).(ps:log2(n+1)是log以2为底,n+1为对数)
5)对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则对
于序号为i的结点有:
1)若i>0,i位置节点的双亲序号:(i-1)/2;i=0,i为根节点编号,无双亲节点2.若2i+1<n,左孩子序号:2i+1,2i+1>=n否则无左孩子3.若2i+2<n,右孩子序号:2i+2,2i+2>=n否则无右孩子
二.二叉树的顺序存储-堆
1.堆的概念
.二叉树的顺序存储适用于完全二叉树,其空间在物理上是连续的,在逻辑上是非连续的是一颗完全二叉树,称之为堆。堆又分为小堆和大堆,小堆是父节点里的值小于等于左右孩子,大堆则相反。
2.堆的实现(以小堆为例)
1)定义堆的结构
#pragma once
#include<stdio.h>
#include<assert.h>
#include<stdlib.h>
#include<time.h>
#include<stdbool.h>
typedef int HPDataType;
//堆的物理结构是顺序表,逻辑结构是二叉树
typedef struct Heap
{
HPDataType* a;
int size;
int capacity;
}HP;
2)堆的初始化和销毁
void HeapInit(HP* php)
{
assert(php);
php->a = NULL;
php->capacity = php->size = 0;
}
void HeapDestroy(HP* php)
{
assert(php);
free(php->a);
php->a = NULL;
}
3)往堆里插入元素
void HeapPush(HP* php, HPDataType x)
{
assert(php);
//先扩
if (php->capacity == php->size)
{
int newcapacity = php->capacity == 0 ? 4 : php->capacity * 2;
HPDataType* tmp = (HPDataType*)realloc(php->a, sizeof(HPDataType) * newcapacity);
if (tmp == NULL)
{
perror("failed realloc");
exit(-1);
}
php->a = tmp;
php->capacity = newcapacity;
}
php->a[php->size] = x;
php->size++;
AdjustUp(php->a, php->size-1);
}
注:这里在插入前,首先要检查是否需要扩容,防止空间不够。其次,这里建堆使用了向上调整算法,可以保证堆里的元素保持大堆或小堆结构。
-->向上调整算法
void AdjustUp(HPDataType* a, int child)
{
int parent = (child - 1) / 2;
while (child > 0)
{
if (a[child] < a[parent])
{
Swap(&a[child], &a[parent]);
}
child = parent;
parent = (parent - 1) / 2;
}
}
4)删除堆里的一个元素(默认删除堆顶元素)
void HeapPop(HP* php)
{
//删除堆顶的元素
assert(php);
assert(php->size > 0);
Swap(&php->a[0], &php->a[php->size - 1]);
php->size--;
AdjustDown(php->a, php->size, 0);
}
-->向下调整算法
void AdjustDown(HPDataType* a, int size, int parent)
{
int child = parent * 2 + 1;
//谨防a[child+1]越界
while (parent < size && child+1 < size )
{
if (a[child] > a[child + 1])
{
child += 1;
}
if (a[parent] > a[child])
{
Swap(&a[parent], &a[child]);
}
parent = child;
child = parent * 2 + 1;
}
}
5)返回堆的大小,判空,返回堆顶元素
int HeapSize(HP* php)
{
assert(php);
return php->size;
}
bool HeapEmpty(HP* php)
{
assert(php);
return php->size == 0;
}
HPDataType HeapTop(HP* php)
{
assert(php);
return php->a[0];
}
3.堆的实际应用
1)TopK求解
即从庞大的数据里筛选出前K个最大或最小的数据。找大值,建小堆,凡是遇到比堆顶大的就替换掉堆顶,并向下调整,保证小堆的结构,越大的值,越会沉底。同样的,找小值,建大堆。
void HeapTopK(int k)
{
//不支持变长数组,只能malloc
HPDataType* min_heap = (HPDataType*)malloc(sizeof(HPDataType) * k);
if (min_heap == NULL)
{
perror("failed malloc");
exit(-1);
}
HPDataType* a = (HPDataType*)malloc(sizeof(HPDataType) * 1000);
if (a == NULL)
{
perror("failed malloc");
exit(-1);
}
srand(time(0));
for (int i = 0; i < 1000; i++)
{
a[i] = (rand() + i) % 1000;
}
a[993] = 1011111;
a[823] = 100021;
a[523] = 100031;
a[223] = 100011;
a[123] = 100041;
//往数组放数据
for (int i = 0; i < k; i++)
{
min_heap[i] = a[i];
}
//向下调整建堆,从最后一个非叶子节点
for (int i = (k -1 -1)/2; i >= 0 ; i--)
{
AdjustDown(min_heap,k, i);
}
//将剩余数据与堆顶比较
int x = 0;
while (x<1000)
{
if (a[x] > min_heap[0])
{
min_heap[0] = a[x];
AdjustDown(min_heap, k, 0);
}
x++;
}
for (int i = 0; i < k; i++)
{
printf("%d ", min_heap[i]);
}
printf("\n");
free(min_heap);
}
注:这里人为的存入5个值,方便进行测试。
2)堆排序
void HeapSort(int* a,int n)
{
//建大堆,排升序
for (int i = (n - 1 - 1) / 2; i >= 0; i--)
{
AdjustDown(a, n, i);
}
for (int i = 0; i < n; i++)
{
printf("%d ", a[i]);
}
printf("\n");
int end = n - 1;
while (end >= 0)
{
Swap(&a[0], &a[end]);
//先调整,此时end刚好是正确的个数,保证是大堆
AdjustDown(a, end, 0);
end--;
}
for (int i = 0; i < n; i++)
{
printf("%d ", a[i]);
}
printf("\n");
}
注:依次将堆顶值(即为最大的值),与堆尾交换,并pop删除一个元素,并进行向下调整,保证次大的值到堆顶。
三.二叉树的链式结构
.链式二叉树,是由一个个节点相互搭建而成,每一个节点包括有效值和左孩子和右孩子的指针。
1)定义节点的结构
#pragma once
#include<stdio.h>
#include<assert.h>
#include<stdlib.h>
#include<stdbool.h>
typedef int BTreeDataType;
typedef struct BTreeNode
{
BTreeDataType val;
struct BTreeNode* left;
struct BTreeNode* right;
}Node;
2)手动造一棵二叉树,方便进行遍历
Node* BuyNode()
{
Node* tmp =(Node*)malloc(sizeof(Node));
tmp->left = NULL;
tmp->right = NULL;
return tmp;
}
Node* BuyTree()
{
Node* node1 = BuyNode();
Node* node2 = BuyNode();
Node* node3 = BuyNode();
Node* node4 = BuyNode();
Node* node5 = BuyNode();
Node* node6 = BuyNode();
node1->val = 1;
node2->val = 2;
node3->val = 3;
node4->val = 4;
node5->val = 5;
node6->val = 6;
node1->left = node2;
node1->right = node3;
node2->left = node4;
node2->right = node5;
node3->left = node6;
return node1;
}v
3)二叉树的遍历
①深度优先遍历(递归写法):前序遍历,中序遍历,后序遍历
->前序遍历(问题分治:根 左子树 右子树,返回条件:遇到空就返回)
->中序遍历(问题分治:左子树 根 右子树,返回条件:遇到空就返回)
->后序遍历(问题分治:左子树 右子树 根 ,返回条件:遇到空就返回)
void PreOrder(Node* root)
{
if (root == NULL)
return;
printf("%d ", root->val);
PreOrder(root->left);
PreOrder(root->right);
}
void MidOrder(Node* root)
{
if (root == NULL)
return;
MidOrder(root->left);
printf("%d ", root->val);
MidOrder(root->right);
}
void BackOrder(Node* root)
{
if (root == NULL)
return;
BackOrder(root->left);
BackOrder(root->right);
printf("%d ", root->val);
}
②广度优先遍历:层序遍历
利用队列先进先出的特性,每入一个元素,在删除它后,把它的左右子孩子放到队列中去(孩子为空不入队列),直到队列为空。
void LeavelOrder(Node* root)
{
Queue queue;
QueueInit(&queue);
if(root)
QueuePush(&queue,root);
while (!QueueEmpty(&queue))
{
Node* front = QueueFront(&queue);
printf("%d ", front->val);
//每出一个元素,将它的左孩子和右孩子带进去
QueuePop(&queue);
//孩子不为空才入队列
if (front->left)
QueuePush(&queue, front->left);
if (front->right)
QueuePush(&queue, front->right);
}
QueueDestroy(&queue);
}
->拓展1:分层打印
只需加入 LevelSize变量,不断--,打印每一层数据,打印完一层后,刷新LevelSize的大小
//分层打印
void LeavelOrder1(Node* root)
{
Queue queue;
QueueInit(&queue);
if (root)
QueuePush(&queue, root);
int LeavelSize = 1;
while (!QueueEmpty(&queue))
{
while (LeavelSize--)
{
Node* front = QueueFront(&queue);
printf("%d ", front->val);
//每出一个元素,将它的左孩子和右孩子带进去
QueuePop(&queue);
//孩子不为空才入队列
if (front->left)
QueuePush(&queue, front->left);
if (front->right)
QueuePush(&queue, front->right);
}
printf("\n");
LeavelSize = QueueSize(&queue);
}
QueueDestroy(&queue);
}
->拓展2:判断一颗树是否为完全二叉树
依据完全二叉树的结构特点,只需要在入队列时,将空指针也入进去,当不断删除队列元素,走到第一个空指针时,如果队列后面全是空指针,则为完全二叉树,反之,有别的有效地址,既不是完全二叉树。
}
//判断是否是完全二叉树
bool isComBTree(Node* root)
{
Queue queue;
QueueInit(&queue);
if (root)
QueuePush(&queue, root);
while (QueueFront(&queue) != NULL)
{
Node* front = QueueFront(&queue);
//printf("%d ", front->val);
//每出一个元素,将它的左孩子和右孩子带进去
QueuePop(&queue);
//空也入队列
/* if (front == NULL)
break;*/
if (front)
{
QueuePush(&queue, front->left);
QueuePush(&queue, front->right);
}
}
while (!QueueEmpty(&queue))
{
if (QueueFront(&queue))
{
QueueDestroy(&queue);
return false;
}
QueuePop(&queue);
}
QueueDestroy(&queue);
return true;
}
4)求二叉树的节点数
.分治:节点数 = 1 + 左子树节点数 + 右子树节点数;返回条件:遇到空指针返回,最终返回1+左子树节点数 + 右子树节点数。
//树的节点个数 分治:1+左子树节点数+右子树节点数
int NodeSize(Node* root)
{
return root == NULL ? 0 : NodeSize(root->left) + NodeSize(root->right) + 1;
}
5)求叶子节点数
.分治:左子树节点数+右子树节点数;返回条件:遇到空,返回0,遇到,叶子返回1,最终返回左子树加右子树。
int LeaftSize(Node* root)
{
if (root == NULL)
return 0;
if (root->left == NULL && root->right == NULL)
return 1;
return LeaftSize(root->left)+ LeaftSize(root->right);
}
6)求树的高度(后序遍历的思想)
.分治:不断比较左子树和右子树的高度,返回高度高的;返回条件:遇到空返回0,最后返回较深子树的深度加1。
//树的高度 后序的思想
int DeepTree(Node* root)
{
if (root == NULL)
return 0;
int LeftDeep = DeepTree(root->left);
int RightDeep = DeepTree(root->right);
return LeftDeep > RightDeep ? LeftDeep + 1 : RightDeep + 1;
}
注:这里最好定义left和right变量,用来记录数据,否则重复调用同一个函数的次数会太多,时间效率会降低。
7)第k层节点数
.分治:k-1层左子树,右子树的节点数,直到k到达第一层;返回条件:遇空返回0,k为1返回1。
int KNodeSize(Node* root,int k)
{
assert(k > 0);
if (root == NULL)
return 0;
if (k == 1)
return 1;
return KNodeSize(root->left, k - 1) + KNodeSize(root->right, k - 1);
}
8)查找为x的节点(前序遍历思想)
.分治:根 左子树 右子树;返回条件:遇到空返回NULL,遇到val为x的节点,返回该节点的地址,遍历完所有节点都没有val为x的节点,则返回空。
//找值为x的节点
Node* FindXNode(Node* root,int x)
{
if (root == NULL)
return NULL;
if (root->val == x)
return root;
//左子树不为空才走
if (root->left)
return FindXNode(root->left, x);
//右子树不为空才走
if (root->right)
return FindXNode(root->right, x);
return NULL;
}
四.小结
二叉树分为物理空间上连续存储的堆,和由一个个节点构成的链式二叉树。堆有着TopK和堆排序的实际应用,其中向上调整算法和向下调整算法是堆学习的关键。而对于链式二叉树,更要理解消化这里递归的思想,尤其是前中后序的遍历,其中递归的思想需要不断练习相关习题才能参透。