2024年大数据最全【数据结构】二叉树详解(下篇),那些年大数据开发面试官常问的知识点

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

void swap(int\* left, int\* right)
{
	int temp = \*left;
	\*left = \*right;
	\*right = temp;
}
//向下调整算法
void AdjustDown(HeapDataType array[], int num, int parent)
{
	int child = parent \* 2 + 1;
	while (child < num)
	{
		if (child + 1 < num && array[child] < array[child + 1])
		{
			child ++ ;
		}
		if (array[child]>array[parent])
		{
			swap(&array[child], &array[parent]);
			parent = child;
			child = parent \* 2 + 1;
		}
		else
		{
			break;
		}
	}
}

void HeapCreat(Heap\* h,int arr[],int num)
{
	h->array = (HeapDataType\*)malloc(sizeof(HeapDataType)\*num);
	memcpy(h->array, arr, sizeof(HeapDataType)\*num);
	for (int root = (num - 2) / 2; root >= 0; --root)
	{
		//建堆
		AdjustDown(h->array, num, root);
	}
	//堆排序
	int end = num - 1;
	while (end)
	{
		swap(&h->array[0], &h->array[end]);
		AdjustDown(h->array, end, 0);
		end--;
	}
}


void HeapTest()
{
	Heap h;
	int arr[10] = { 5, 4, 3, 9, 7, 6, 1, 2, 8, 0 };
	int num = sizeof(arr) / sizeof(arr[0]);
	HeapCreat(&h, arr, num);
	for (int i = 0; i < num; i++)
	{
		printf("%d ", h.array[i]);
	}
	printf("\n");
}

2. TOP-K问题

TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。

对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下:

  1. 用数据集合中前K个元素来建堆

前k个最大的元素,则建小堆;前k个最小的元素,则建大堆

  1. 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素

将剩余N-K个元素依次与堆顶元素进行比较,若符合条件进行交换(大堆,小于堆顶元素;小堆,大于堆顶元素),再完成向下调整算法,直到剩余的N-K个元素都已比较完,最后堆中剩余的K个元素就是所求前K个最小或者最大的元素。

代码实现:(选择十个数字中的前三大,建小堆)

void Swap(HPDataType\* left, HPDataType\* right)
{
	HPDataType temp = \*left;
	\*left = \*right;
	\*right = temp;
}

void AdjustDown(Heap\* hp, int n, int parent)
{
	int child = parent \* 2 + 1;
	while (child < n)
	{
		if (child + 1 < n&&hp->array[child] > hp->array[child + 1])
		{
			child += 1;
		}
		if (hp->array[child] < hp->array[parent])
		{
			Swap(&hp->array[child], &hp->array[parent]);
			parent = child;
			child = parent \* 2 + 1;
		}
		else
		{
			return;
		}
	}
}

void HeapCreate(Heap\* hp, HPDataType\* a, int n)
{
	assert(hp);
	hp->array = (HPDataType\*)malloc(sizeof(HPDataType)\*n);
	if (hp->array == NULL)
	{
		return;
	}
	memcpy(hp->array, a, sizeof(HPDataType)\*n);
	hp->size = hp->capacity = n;
	
	//先建小堆(3个元素)
	for (int root = (n - 2) / 2; root >= 0; root--)
	{
		AdjustDown(hp, n, root);
	}
	
	//再将剩余7个元素与根结点比较插入
	for (int i = n; i < 10; i++)
	{
		//取前三大元素,建小堆,大于堆顶元素进行交换,判断,调整
		if (a[i]>hp->array[0])
		{
			Swap(&a[i], &hp->array[0]);
			AdjustDown(hp, 3, 0);
		}
	}
}

void Test()
{
	int arr[10] = { 5, 8, 1, 6, 3, 0, 2, 7, 4, 9 };
	Heap hp;
	HeapCreate(&hp, arr, 3);
	for (int i = 0; i < 3; i++)
	{
		printf("%d ", hp.array[i]);
	}
	printf("\n");

}

二、二叉树链式结构的实现

1.二叉树的结构

结点类型,包括左右孩子指针以及该结点的数值域

typedef struct BTNode
{
	struct BTNode\* Lchild;
	struct BTNode\* Rchild;
	BTNDataType data;
}BTNode;

在这里插入图片描述

2.二叉树的遍历

二叉树的遍历是指按某条搜索路径访问树中的每个结点,使得每个结点均被访问每一次,而且仅访问一次。由于二叉树是一种非线性结构,每个结点都可能有两棵子树,因而需要寻找一种规律,以便使二叉树上的结点能排列在一个线性队列上,进而便于遍历。
  由二叉树的递归定义可知,遍历一棵二叉树便要决定对根结点 N、左子树L 和右子树R 的访问顺序。按照先遍历左子树再遍历右子树的原则,常见的遍历次序有先序 (NLR)、中序 (LNR)和后序(LRN)三种遍历算法,其中 “序” 指的是根结点在何时被访问。

2.1 前序遍历

访问根结点,先序遍历左子树,先序遍历右子树

void PreOrder(BTNode\* root)
{
	if (root == NULL)
	{
		return;
	}
	printf("%d ", root->data);
	PreOrder(root->left);
	PreOrder(root->right);
}

2.2 中序遍历

中序遍历左子树,访问根结点,中序遍历右子树

void InOrder(BTNode\* root)
{
	if (root == NULL)
	{
		return;
	}
	InOrder(root->left);
	printf("%d ", root->data);
	InOrder(root->right);
}

2.3 后序遍历

后序遍历左子树,后序遍历右子树,访问根结点

void PostOrder(BTNode\* root)
{
	if (root == NULL)
	{
		return;
	}
	PostOrder(root->left);
	PostOrder(root->right);
	printf("%d ", root->data);
}

2.4 层序遍历

除了先序遍历、中序遍历、后序遍历外,还可以对二叉树进行层序遍历。设二叉树的根节点所在层数为1,层序遍历就是从所在二叉树的根节点出发,首先访问第一层的树根节点,然后从左到右访问第2层上的节点,接着是第三层的节点,以此类推,自上而下,自左至右逐层访问树的结点的过程就是层序遍历。
  对于目前知识储备,我们只能选择通过队列来完成对二叉树的层序遍历,大致思路就是先将根结点入队,然后在其出队的同时将它的两个孩子结点入队,一直持续到队列为空(当孩子结点为空时不入队)

主要代码:

typedef struct BinaryTreeNode\* QDataType;

void LeverOrder(BTNode\* root)
{
	Queue q;
	QueueInit(&q);
	int leverSize = 0;
	//先入根结点
	if (root != NULL)
	{
		QueuePush(&q, root);
		leverSize = 1;
	}
	while (!QueueEmpty(&q))
	{
		//此处的leverSize记录的是每一行的结点个数
		while (leverSize--)
		{
			//注意:在这里,对头的返回值类型本应该是 int 类型的,但是为了后续的结点访问,
			//要将其强制转化为二叉树结点类型
			BTNode\* front = QueueFront(&q);
			printf("%d ", front->data);
			QueuePop(&q);
			if (front->left)
			{
				QueuePush(&q, front->left);
			}
			if (front->right)
			{
				QueuePush(&q, front->right);
			}
		}
		printf("\n");
		leverSize = QueueSize(&q);
	}
	printf("\n");
	QueueDestroy(&q);
}

3.二叉树的相关练习

3.1 二叉树节点个数

通过全局变量进行计数,每到一个结点就总数++

//全局变量计数
int size = 0;
int TreeNodeNum(BTNode\* root)
{
	if (root == NULL)
	{
		return 0;
	}
	size++;
	TreeNodeNum(root->left);
	TreeNodeNum(root->right);
	return size;
}

3.2 二叉树的高度

一直递归到最后一层,根据左右子树的高度进行比较加一获取当前结点的高度。

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

子树的高度进行比较加一获取当前结点的高度。

[外链图片转存中…(img-2QC2MGC6-1715248304147)]
[外链图片转存中…(img-x6LBFdwz-1715248304147)]

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 5
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值