数据结构6---树

一、定义

树(Tree)是n(n>=0)个结点的有限集。当n=0时成为空树,在任意一棵非空树中:

        1、有且仅有一个特定的称为根(Root)的结点;

        2、当n>1时,其余结点可分为m(m>日)个互不相交的有限集T1、T2、...、 Tm,其中每一个集合本身又是一棵树,并且称为根的子树(SubTree)。

需要注意的是:

1、n>6时,根结点是唯一的,坚决不可能存在多个根结点。

2、m>0时,子树的个数是没有限制的,但它们互相是一定不会相交的。

二、节点分类

刚才所有图片中,每一个圈圈我们就称为树的一个结点。结点拥有的子树数称为结点的度-

(Degree),树的度取树内各结点的度的最大值。

1、度为0的结点称为叶结点(Leaf)或终端结点;

2、度不为0的结点称为分支结点或非终端结点,除根结点外,分支结点也称为内部结点。

三、结点间的关系

结点的子树的根称为结点的孩子(Child),相应的,该结点称为孩子的双亲(Parent),同一双亲的孩子之间互称为兄弟(Sibling)。

结点的祖先是从根到该结点所经分支上的所有结点。

四、节点的层次

  • 结点的层次(Level)从根开始定一起,根为第一层,根的孩子为第二层。
  • 其双亲在同一层的结点互为堂兄弟。
  • 树中结点的最大层次称为树的深度(Depth)或高度。

五、其他概念

  • 如果将树中结点的各子树看成从左至右是有次序的,不能互换的,则称该树为有序树,否则称为无序树。
  • 森林(Forest)是 m(m>=0)棵互不相交的树的集合。对树中每个结点而言,其子树的集合即为森林。

六、树的存储结构

1、双亲表示法

双亲表示法,言外之意就是以双亲作为索引的关键词的一种存储方式。

我们假设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示其双亲结点在数组中位置的元素。

也就是说,每个结点除了知道自己是谁之外,还知道它的粑粑妈妈在哪里。

定义一个结构体

#define MAXSIZE 100

typedef struct PTNode {
	int data;	//结点数据
	int parent;	//双亲位置
}PTNode;

typedef struct {
	PTNode node[MAXSIZE];
	int r;	//根的位置
	int n;	//节点数目
}PTree;

 这样的存储结构,我们可以根据某结点的parent指针找到它的双亲结点,所用的时间复杂度是0(1),索引到parent的值为-1时,表示找到了树结点的根。

可是,如果我们要知道某结点的孩子是什么?那么不好意思,请遍历整个树结构

2、孩子表示法

3、双亲孩子表示法

//孩子节点
typedef struct CTNode {
	int child;	//孩子结点的下标
	struct CTNode* next;	//指向下一个孩子结点的指针
}*ChildPtr;

//表头结构
typedef struct {
	int data;	//存放在树中的节点数据
	int paraent;	//存放双亲的下标
	ChildPtr friendchild;	//指向第一个孩子的指针
}CTBox;

//树结构
typedef struct {
	CTBox node[MAXSIZE];
	int r, n;
}CTTree;

七、二叉树

1、定义

二叉树(Binary Tree)是n(n>=0)个结点的有限集合,该集合或者为空集(空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树的二叉树组成。

注意:

每个结点最多有两棵子树,所以二叉树中不存在度大于2的结点。(注意:不是都需要两棵子树,而是最多可以是两棵,没有子树或者有一棵子树也都是可以的。)

左子树和右子树是有顺序的,次序不能颠倒。

即使树中某结点只有一棵子树,也要区分它是左子树还是右子树,下面是完全不同的二叉树:

2、五种基本形态

(1)空二叉树

(2)只有一个根结点

(3)根结点只有左子树

(4)根结点只有右子树

(5)根结点既有左子树又有右子树

3、特殊二叉树

(1)斜树

斜树是一定要斜的,但斜也要斜寻有范儿

(2)满二叉树

在一棵二叉树中,如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上,这样的二叉树称为满二叉树。

特点:

  • 叶子只能出现在最下一层。
  • 非叶子结点的度一定是2。
  • 在同样深度的二叉树中,满二又树的结点个数一定最多,同时叶子也是最多。

(3)完全二叉树

对一棵具有n个结点的二叉树按层序编号,如果编号为i(1<=i<=n)的结点与同样深度的满二叉树中编号为i的结点位置完全相同,则这棵二叉树称为完全二叉树。

这个也是满二叉树

特点:

  • 叶子结点只能出现在最下两层。
  • 最下层的叶子一定集中在左部连续位置。
  • 倒数第二层,若有叶子结点,一定都在右部连续位置。
  • 如果结点度为1,则该结点只有左孩子。
  • 同样结点树的二叉树,完全二叉树的深度最小。

注意:满二叉树一定是完全二叉树,但完全二叉树不一定是满二叉树。

重点:

二叉树的性质一:在二叉树的第i层上至多2^(i-1)个结点(i>=1)

二叉树的性质二:深度为k的二叉树至多有2^k-1个结点(k>=1)

二叉树的性质三:对任何一棵二叉树T,如果其终端结点数为n0,度为2的结点数为n2,则n0=n2+1

(打岔一下,在纸面上写写画画很重要的!!!)

二叉树的性质四:具有n个结点的完全二叉树的深度为\left \lfloor log_2{n} \right \rfloor + 1 ,向下取整

二叉树的性质五:如果对一棵有n个结点的完全二叉树(其深度为[log2n]+1)的结点按层序编号,对任一结点i(1<=i<=n)有以下性质:

  1. 如果i =1,则结点i是二叉树的根,无双亲;如果i >1,则其双亲是结点\left \lfloor i/2 \right \rfloor
  2. 如果2i > n,则结点i无左孩子(结点i为叶子结点);否则其左孩子是结点2i
  3. 如果2i+1 >n,则结点i无右孩子;否则其右孩子是结点2i+1

4、存储结构

(1)顺序存储

对于完全二叉树是十分方便的,但是一般二叉树就不行了,空间会造成极大的浪费

(2)链式存储!!!!

结点结构

代码

typedef struct BiNode {
	int data;
	struct BiTNode* lchild, * rchild;
}BiTNode,*BiTree;

5、二叉树的遍历

(1)先序遍历

        根——>左子树——>右子树

        ABDHIEJCFKG

(2)中序遍历

        左子树——>根——>右子树

        HDIBEGAFKCG

(3)后序遍历

        左子树——>右子树——>根

        HIDJEBKFGCA

(4)层序遍历

        ABCDEFGHIJK

八、二叉树的建立和遍历算法

代码(包括递归和非递归遍历):

#define _CRT_SECURE_NO_WARNINGS 1;
#include <stdio.h>  
#include <stdlib.h>  

typedef struct TreeNode {
    char val;
    struct TreeNode* left;
    struct TreeNode* right;
} TreeNode;

TreeNode* createTree(char** str) {
    //*str就是 char数组的指针
    if (**str == '#') {
        (*str)++;   //指针偏移
        return NULL;
    }

    TreeNode* node = (TreeNode*)malloc(sizeof(TreeNode));
    node->val = **str;
    (*str)++;

    //这里递归实现,从根节点开始往左子树里填
    node->left = createTree(str);
    node->right = createTree(str);

    return node;
}

// 递归遍历  
void preOrderRecursive(TreeNode* root) {
    if (root == NULL) return;
    printf("%c ", root->val);
    preOrderRecursive(root->left);
    preOrderRecursive(root->right);
}

void inOrderRecursive(TreeNode* root) {
    if (root == NULL) return;
    inOrderRecursive(root->left);
    printf("%c ", root->val);
    inOrderRecursive(root->right);
}

void postOrderRecursive(TreeNode* root) {
    if (root == NULL) return;
    postOrderRecursive(root->left);
    postOrderRecursive(root->right);
    printf("%c ", root->val);
}

// 非递归遍历使用栈来辅助  
#define MAX_SIZE 100  
typedef struct {
    TreeNode* data[MAX_SIZE];
    int top;
} Stack;

void initStack(Stack* s) {
    s->top = -1;
}

int isEmpty(Stack* s) {
    return s->top == -1;
}

int isFull(Stack* s) {
    return s->top == MAX_SIZE - 1;
}

void push(Stack* s, TreeNode* node) {
    if (isFull(s)) return;
    s->data[++(s->top)] = node;
}

TreeNode* pop(Stack* s) {
    if (isEmpty(s)) return NULL;
    return s->data[(s->top)--];
}

void preOrderNonRecursive(TreeNode* root) {
    if (root == NULL) return;
    Stack s;
    initStack(&s);
    push(&s, root);
    while (!isEmpty(&s)) {
        TreeNode* node = pop(&s);
        printf("%c ", node->val);
        if (node->right) push(&s, node->right);
        if (node->left) push(&s, node->left);
    }
}

void inOrderNonRecursive(TreeNode* root) {
    Stack s;
    initStack(&s);
    TreeNode* cur = root;
    while (cur || !isEmpty(&s)) {
        while (cur) {
            push(&s, cur);
            cur = cur->left;
        }
        cur = pop(&s);
        printf("%c ", cur->val);
        cur = cur->right;
    }
}

void postOrderNonRecursive(TreeNode* root) {
    if (root == NULL) return;
    Stack s1, s2;
    initStack(&s1);
    initStack(&s2);
    push(&s1, root);
    while (!isEmpty(&s1)) {
        TreeNode* node = pop(&s1);
        push(&s2, node);
        if (node->left) push(&s1, node->left);
        if (node->right) push(&s1, node->right);
    }
    while (!isEmpty(&s2)) {
        TreeNode* node = pop(&s2);
        printf("%c ", node->val);
    }
}

int main() {
    char input[101];
    scanf("%s", input);
    char* str = input;
    TreeNode* root = createTree(&str);

    // 递归遍历  
    preOrderRecursive(root);
    printf("\n");
    inOrderRecursive(root);
    printf("\n");
    postOrderRecursive(root);
    printf("\n");

    // 非递归遍历  
    preOrderNonRecursive(root);
    printf("\n");
    inOrderNonRecursive(root);
    printf("\n");
    postOrderNonRecursive(root);
    printf("\n");

    return 0;
}

这里的递归好理解,对于非递归

九、线索二叉树

结构体

//二叉树的二又线索存储表示
typedef struct BiThrNode{
    TElemType data;
    struct BiThrNode *lchild, *rchild;
    int LTag, RTag;
}BiThrNode, *BiThrTree;

用实线表示孩子节点,虚线表示前驱后继

中序线索代码实现

结构体

typedef struct Thread {
	struct Thread* left_node, * right_node;//左右指针
	int data;//需要存放的数据
	/*默认0代表左右孩子 1代表前驱或者后继*/
	int left_type;//类型标志
	int right_type;//类型标志
}Node;

Node* pre;//前驱结点的变量
Node* head;//头指针 指向某种遍历的第一个结点

线索化

void inOrderThreadTree(Node* node)
{
	//如果当前结点为NULL 直接返回
	if (node == NULL) {
		return;
	}
	//先处理左子树
	inOrderThreadTree(node->left_node);
	if (node->left_node == NULL)
	{
		//设置前驱结点
		node->left_type = 1;
		node->left_node = pre;
	}
	//如果结点的右子节点为NULL 处理前驱的右指针
	if (pre !=NULL && pre->right_node == NULL)
	{
		//设置后继
		pre->right_node = node;
		pre->right_type = 1;
	}
	//每处理一个节点 当前结点是下一个节点的前驱
	pre = node;
	//最后处理右子树
	inOrderThreadTree(node->right_node);
}

遍历

void inOrderTraverse(Node* root)
{
	//从根节点开始先找到最左边
	if (root == NULL)
	{
		return;
	}
	Node* temp = root;
	//先找到最左边结点 然后根据线索化直接向右遍历
	while (temp != NULL && temp->left_type == 0)
	{
		temp = temp->left_node;
	}
	while (temp != NULL)
	{
		//输出
		temp = temp->right_node;
	}
}

这里停一下,时间不多,前驱后继就不写了哈 

十、树、森林继二叉树的相互转换

1、树转换为二叉树

树转换成相应的二叉树分两个步骤:

  1. 在树中所有的兄弟结点之间加一连线
  2. 对每个结点,除了保留与其长子的连线外,去掉该结点与其他孩子的连线

只有左子树

 2、森林到二叉树的转换

森林转换为二叉树分两个步骤:

  1. 先将森林中的每棵树变为二叉树
  2. 再将各二叉树的根结点视为兄弟从左至右连在一起,就形成了一棵二叉树

3、二叉树到树、森林的转换

  1. 若结点x是其双亲y的左孩子,则把x的右孩子,右孩子的右孩子,…,都与y用连线连起来。
  2. 去掉所有双亲到右孩子之间的连线

4、树与森林的遍历

树的遍历分为两种方式:一种是先根遍历,另一种是后根遍历。

  • 先根遍历:先访问树的根结点,然后再依次先根遍历根的每棵子树。
  • 后根遍历:先依次遍历每棵子树,然后再访问根结点。

先根遍历:ABEFCGDHIJ

后根遍历:EFBGCHIJDA


森林的遍历也分为前序遍历和后序遍历,其实就是按照树的先根遍历和后根遍历依次访问森林的每一棵树。
我们的惊人发现:树、森林的前根(序)遍历和二叉树的前序遍历结果相同,树、森林的后根(序)遍历和二叉树的中序遍历结果相同!

十一、哈夫曼树

1、定义

我们先把这两棵二叉树简化成叶子结点带权的二叉树(注:树结点间的连线相关的数叫做权,Weight) 。

  • 结点的路径长度:从根结点到该结点的路径上的连接数。        第一幅图C的就是3
  • 树的路径长度:树中每个叶子结点的路径长度之和。      第一幅图为1+2+3+3 = 9
  • 结点带权路径长度:结点的路径长度与结点权值的乘积。       第一幅图C的就是3*70=210
  • 树的带权路径长度:-WPL(Weighted Path Length)是树中所有叶子结点的带权路径长度之和。第一幅图为1*5+2*15+3*70+3*10 = 275

WPL的值越小,说明构造出来的二叉树性能越优。

构造过程:

1、构造森林全是根;        2、选用两小造新树;

3、删除两小添新人        ;4、重复2、3剩单根。

2、哈夫曼树的构建

结构体

//哈夫曼树结点结构
typedef struct {
    int weight;//结点权重
    int parent, left, right;//父结点、左孩子、右孩子在数组中的位置下标
}HTNode, *HuffmanTree;

构建

 

//HT为地址传递的存储哈夫曼树的数组,w为存储结点权重值的数组,n为结点个数
void CreateHuffmanTree(HuffmanTree *HT, int *w, int n)
{
    if(n<=1) return; // 如果只有一个编码就相当于0
    int m = 2*n-1; // 哈夫曼树总节点数,n就是叶子结点
    *HT = (HuffmanTree) malloc((m+1) * sizeof(HTNode)); // 0号位置不用
    HuffmanTree p = *HT;
    // 初始化哈夫曼树中的所有结点
    for(int i = 1; i <= n; i++)
    {
        (p+i)->weight = *(w+i-1);
        (p+i)->parent = 0;
        (p+i)->left = 0;
        (p+i)->right = 0;
    }
    //从树组的下标 n+1 开始初始化哈夫曼树中除叶子结点外的结点
    for(int i = n+1; i <= m; i++)
    {
        (p+i)->weight = 0;
        (p+i)->parent = 0;
        (p+i)->left = 0;
        (p+i)->right = 0;
    }
    //构建哈夫曼树
    for(int i = n+1; i <= m; i++)
    {
        int s1, s2;
        Select(*HT, i-1, &s1, &s2);
        (*HT)[s1].parent = (*HT)[s2].parent = i;
        (*HT)[i].left = s1;
        (*HT)[i].right = s2;
        (*HT)[i].weight = (*HT)[s1].weight + (*HT)[s2].weight;
    }
}

3、重难点:哈夫曼编码

1. 计算字符串中每个字符的频率

2. 按照字符出现的频率进行排序,组成一个队列 Q

3. 把这些字符作为叶子节点开始构建一棵哈夫曼树

4. 对字符进行编码

哈夫曼树和编码都不唯一!只有树的WPL(带权路径长度)才是唯一的!

代码实现:

#include <stdio.h>
#include <stdlib.h>

// 定义哈夫曼树节点结构
typedef struct HuffmanNode {
    char data;              // 字符
    int freq;               // 频率
    struct HuffmanNode* left, * right;   // 左右子节点
} HuffmanNode;

// 定义优先级队列结构
typedef struct PriorityQueue {
    int size;               // 队列当前大小
    int capacity;           // 队列容量
    HuffmanNode** array;    // 存储哈夫曼树节点的数组指针
} PriorityQueue;

// 创建哈夫曼树节点
HuffmanNode* createNode(char data, int freq) {
    HuffmanNode* node = (HuffmanNode*)malloc(sizeof(HuffmanNode));  // 分配内存空间
    node->data = data;  // 设置节点字符
    node->freq = freq;  // 设置节点频率
    node->left = node->right = NULL;   // 初始化左右子节点为空
    return node;  // 返回节点指针
}

// 创建优先级队列
PriorityQueue* createPriorityQueue(int capacity) {
    PriorityQueue* queue = (PriorityQueue*)malloc(sizeof(PriorityQueue));  // 分配内存空间
    queue->size = 0;  // 初始化队列大小为0
    queue->capacity = capacity;  // 设置队列容量
    queue->array = (HuffmanNode**)malloc(queue->capacity * sizeof(HuffmanNode*));  // 分配内存空间
    return queue;  // 返回队列指针
}

// 交换两个节点
void swapNodes(HuffmanNode** a, HuffmanNode** b) {
    HuffmanNode* temp = *a;
    *a = *b;
    *b = temp;
}

// 向下堆化
void minHeapify(PriorityQueue* queue, int idx) {
    int smallest = idx;
    int left = 2 * idx + 1;  // 计算左子节点索引
    int right = 2 * idx + 2;  // 计算右子节点索引

    // 找出三个节点中最小的节点
    if (left < queue->size && queue->array[left]->freq < queue->array[smallest]->freq) {
        smallest = left;
    }
    if (right < queue->size && queue->array[right]->freq < queue->array[smallest]->freq) {
        smallest = right;
    }

    // 如果最小节点不是当前节点,交换节点并递归向下堆化
    if (smallest != idx) {
        swapNodes(&queue->array[idx], &queue->array[smallest]);
        minHeapify(queue, smallest);
    }
}

// 插入节点
void insertNode(PriorityQueue* queue, HuffmanNode* node) {
    queue->size++;  // 队列大小加1
    int i = queue->size - 1;  // 获取最后一个位置的索引

    queue->array[i] = node;  // 将节点插入最后一个位置

    // 如果插入节点的频率小于父节点的频率,向上调整
    while (i && queue->array[i]->freq < queue->array[(i - 1) / 2]->freq) {
        swapNodes(&queue->array[i], &queue->array[(i - 1) / 2]);
        i = (i - 1) / 2;
    }
}

// 提取最小节点
HuffmanNode* extractMin(PriorityQueue* queue) {
    if (queue->size == 0) return NULL;  // 如果队列为空,返回空指针

    HuffmanNode* root = queue->array[0];  // 获取根节点
    queue->array[0] = queue->array[queue->size - 1];  // 将最后一个节点移到根节点位置
    queue->size--;  // 队列大小减1

    minHeapify(queue, 0);  // 向下堆化

    return root;  // 返回根节点
}

// 构建哈夫曼树
HuffmanNode* buildHuffmanTree(char data[], int freq[], int size) {
    PriorityQueue* queue = createPriorityQueue(size);  // 创建优先级队列

    // 将字符和频率构建成哈夫曼树节点,并插入优先级队列中
    for (int i = 0; i < size; i++) {
        insertNode(queue, createNode(data[i], freq[i]));
    }

    // 从优先级队列中不断取出最小的两个节点,构建哈夫曼树,直到队列中只剩一个节点
    while (queue->size != 1) {
        HuffmanNode* left = extractMin(queue);
        HuffmanNode* right = extractMin(queue);

        // 创建新节点作为父节点,频率为左右子节点频率之和
        HuffmanNode* top = createNode('\0', left->freq + right->freq);
        top->left = left;
        top->right = right;

        // 插入新节点到队列中
        insertNode(queue, top);
    }

    // 返回根节点
    return extractMin(queue);
}

// 打印哈夫曼编码
void printHuffmanCodes(HuffmanNode* root, int arr[], int top) {
    // 遍历树,生成编码
    if (root->left) {
        arr[top] = 0;
        printHuffmanCodes(root->left, arr, top + 1);
    }

    if (root->right) {
        arr[top] = 1;
        printHuffmanCodes(root->right, arr, top + 1);
    }

    // 当遍历到叶子节点时,打印字符及其编码
    if (!root->left && !root->right) {
        printf("%c: ", root->data);
        for (int i = 0; i < top; i++) {
            printf("%d", arr[i]);
        }
        printf("\n");
    }
}

// 主函数
int main() {
    char data[] = { 'a', 'b', 'c', 'd', 'e', 'f' };  // 字符集合
    int freq[] = { 5, 9, 12, 13, 16, 45 };           // 字符频率
    int size = sizeof(data) / sizeof(data[0]);       // 字符集合大小

    // 构建哈夫曼树
    HuffmanNode* root = buildHuffmanTree(data, freq, size);

    int arr[100];  // 存储编码的数组
    int top = 0;   // 记录编码
    // 打印哈夫曼编码
    printf("哈夫曼编码:\n");
    printHuffmanCodes(root, arr, top);

    return 0;
}

有点难,啧,我再想想

  • 18
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值