数据结构与算法（六）二叉树

最新推荐文章于 2021-12-11 11:26:33 发布

钦拆大仁

最新推荐文章于 2021-12-11 11:26:33 发布

阅读量214

点赞数

分类专栏： # 常用算法文章标签：二叉树

本文链接：https://blog.csdn.net/qq_36154832/article/details/100593839

版权

常用算法专栏收录该内容

16 篇文章 0 订阅

订阅专栏

简介

二叉树是树的一种，数还包括红黑树、2-3-4树。为什么要用树呢？因为它结合了数组和链表两种数据结构的优点。众所周知，链表有查询慢插入删除快的特点，数组查询快删除添加慢。树结构能完美的解决这个问题。

什么是树

树（tree）是一种抽象数据类型（ADT），用来模拟具有树状结构性质的数据集合。它是由n（n>0）个有限节点通过连接它们的边组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。

树的常用术语

路径：顺着节点的边从一个节点走到另一个节点，所经过的节点的顺序排列就称为“路径”。
根：树顶端的节点称为根。一棵树只有一个根，如果要把一个节点和边的集合称为树，那么从根到其他任何一个节点都必须有且只有一条路径。A是根节点。
父节点：若一个节点含有子节点，则这个节点称为其子节点的父节点；B是D的父节点。
子节点：一个节点含有的子树的根节点称为该节点的子节点；D是B的子节点。
兄弟节点：具有相同父节点的节点互称为兄弟节点；比如上图的D和E就互称为兄弟节点。
叶节点：没有子节点的节点称为叶节点，也叫叶子节点，比如上图的H、E、F、G都是叶子节点。
子树：每个节点都可以作为子树的根，它和它所有的子节点、子节点的子节点等都包含在子树中。
节点的层次：从根开始定义，根为第一层，根的子节点为第二层，以此类推。
深度：对于任意节点n,n的深度为从根到n的唯一路径长，根的深度为0；
高度：对于任意节点n,n的高度为从n到一片树叶的最长路径长，所有树叶的高度为0；

二叉树

树的每个节点最多只能有两个子节点的树称之为二叉树。二叉树每个节点的子节点成为左节点和右节点。左节点的值要小于父节点，右节点的值要大于等于父节点。

Java模拟实现二叉树

Node.java

public class Node {
	
	int data;
	Node leftChild;
	Node rightChild;

	public Node(int data) {
		this.data = data;
	}

	public void display() {
		System.out.println(data);
	}

}

BinaryTree.java

public class BinaryTree {
	/**
	 * 根节点
	 */
	private Node root;
	/**
	 * insert:插入节点
	 */
	public boolean insert(int data) {
		Node newNode = new Node(data);
		if (root == null) {//当前树为空树，没有任何节点
			root = newNode;
			return true;
		} else {
			Node current = root;
			Node parentNode = null;
			while (current != null) {
				parentNode = current;
				if (current.data > data) {//当前值比插入值大，搜索左子节点
					current = current.leftChild;
					if (current == null) {//左子节点为空，直接将新值插入到该节点
						parentNode.leftChild = newNode;
						return true;
					}
				} else {
					current = current.rightChild;
					if (current == null) {//右子节点为空，直接将新值插入到该节点
						parentNode.rightChild = newNode;
						return true;
					}
				}
			}
		}
		return false;
	}
	/**
	 * preOrder:前序遍历
	 */
	public void preOrder(Node current) {
		if (current != null) {
			System.out.print(current.data + " ");
			preOrder(current.leftChild);
			preOrder(current.rightChild);
		}
		}
	/**
	 * infixOrder:中序遍历
	 */
	public void infixOrder(Node current) {
		if (current != null) {
			infixOrder(current.leftChild);
			System.out.print(current.data + " ");
			infixOrder(current.rightChild);
		}
		}
	/**
	 * postOrder:后序遍历
	 */
	public void postOrder(Node current) {
		if (current != null) {
			postOrder(current.leftChild);
			postOrder(current.rightChild);
			System.out.print(current.data + " ");
		}
		}
	/**
	 * findMax:返回最大值
	 */
	public Node findMax() {
		Node current = root;
		Node maxNode = current;
		while (current != null) {
			maxNode = current;
			current = current.rightChild;
		}
		return maxNode;
	}
	/**
	 * findMin:返回最小值
	 */
	public Node findMin() {
		Node current = root;
		Node minNode = current;
		while (current != null) {
			minNode = current;
			current = current.leftChild;
		}
		return minNode;
	}
	/**
	 * find查找节点
	 */
	public Node find(int key) {
		Node current = root;
		while (current != null) {
			if (current.data > key) {
				current = current.leftChild;
			} else if (current.data < key) {
				current = current.rightChild;
			} else {
				return current;
			}
		}
		return null;
	}
	/**
	 * delete删除指定节点
	 */
	public boolean delete(int key) {
		Node current = root;
		Node parent = root;
		boolean isLeftChild = false;
		//查找删除值，找不到直接返回false
		while (current.data != key) {
			parent = current;
			if (current.data > key) {
				isLeftChild = true;
				current = current.leftChild;
			} else {
				isLeftChild = false;
				current = current.rightChild;
			}
			if (current == null) {
				return false;
			}
		}
		//如果当前节点没有子节点
		if (current.leftChild == null && current.rightChild == null) {
			if (current == root) {
				root = null;
			} else if (isLeftChild) {
				parent.leftChild = null;
			} else {
				parent.rightChild = null;
			}
			return true;

			//当前节点有一个子节点，右子节点
		} else if (current.leftChild == null && current.rightChild != null) {
			if (current == root) {
				root = current.rightChild;
			} else if (isLeftChild) {
				parent.leftChild = current.rightChild;
			} else {
				parent.rightChild = current.rightChild;
			}
			return true;
			//当前节点有一个子节点，左子节点
		} else if (current.leftChild != null && current.rightChild == null) {
			if (current == root) {
				root = current.leftChild;
			} else if (isLeftChild) {
				parent.leftChild = current.leftChild;
			} else {
				parent.rightChild = current.leftChild;
			}
			return true;
		} else {
			//当前节点存在两个子节点
			Node successor = getSuccessor(current);
			if (current == root) {
				root = successor;
			} else if (isLeftChild) {
				parent.leftChild = successor;
			} else {
				parent.rightChild = successor;
			}
			successor.leftChild = current.leftChild;
		}
		return false;
	}
	public Node getSuccessor(Node delNode) {
		Node successorParent = delNode;
		Node successor = delNode;
		Node current = delNode.rightChild;
		while (current != null) {
			successorParent = successor;
			successor = current;
			current = current.leftChild;
		}
		//后继节点不是删除节点的右子节点，将后继节点替换删除节点
		if (successor != delNode.rightChild) {
			successorParent.leftChild = successor.rightChild;
			successor.rightChild = delNode.rightChild;
		}
		return successor;
	}

	public static void main(String[] args) {
		BinaryTree bt = new BinaryTree();
		bt.insert(50);
		bt.insert(20);
		bt.insert(10);
		bt.insert(30);
		bt.insert(60);
		bt.insert(100);
		bt.infixOrder(bt.root);
		System.out.println();
		bt.find(30).display();
		bt.delete(20);
		bt.infixOrder(bt.root);
	}
}

执行结果

哈夫曼(Huffman)编码

我们知道计算机里每个字符在没有压缩的文本文件中由一个字节（比如ASCII码）或两个字节（比如Unicode,这个编码在各种语言中通用）表示，在这些方案中，每个字符需要相同的位数。

有很多压缩数据的方法，就是减少表示最常用字符的位数量，比如英语中，E是最常用的字母，我们可以只用两位01来表示，2位有四种组合：00、01、10、11，那么我们可以用这四种组合表示四种常用的字符吗？

答案是不可以的，因为在编码序列中是没有空格或其他特殊字符存在的，全都是有0和1构成的序列，比如E用01来表示，X用01011000表示，那么在解码的时候就弄不清楚01是表示E还是表示X的起始部分，所以在编码的时候就定下了一个规则：每个代码都不能是其它代码的前缀。

哈夫曼编码

二叉树中有一种特别的树——哈夫曼树（最优二叉树），其通过某种规则（权值）来构造出一哈夫曼二叉树，在这个二叉树中，只有叶子节点才是有效的数据节点（很重要），其他的非叶子节点是为了构造出哈夫曼而引入的！
哈夫曼编码是一个通过哈夫曼树进行的一种编码，一般情况下，以字符：‘0’与‘1’表示。编码的实现过程很简单，只要实现哈夫曼树，通过遍历哈夫曼树，规定向左子树遍历一个节点编码为“0”，向右遍历一个节点编码为“1”，结束条件就是遍历到叶子节点！因为上面说过：哈夫曼树叶子节点才是有效数据节点！

我们用01表示S，用00表示空格后，就不能用01和11表示某个字符了，因为它们是其它字符的前缀。在看三位的组合，分别有000,001,010,100,101,110和111，A是010，I是110，为什么没有其它三位的组合了呢？因为已知是不能用01和11开始的组合了，那么就减少了四种选择，同时011用于U和换行符的开始，111用于E和Y的开始，这样就只剩下2个三位的组合了，同理可以理解为什么只有三个四位的代码可用。

所以对于消息：SUSIE SAYS IT IS EASY

哈夫曼编码为：100111110110111100100101110100011001100011010001111010101110