构成哈夫曼树的步骤:
1)从小到大进行排序,将每一个数据,每一个数据都是一个结点,每个结点可以看成是一棵最简单的二叉树。
2)去除根结点最小的两棵二叉树。
3)组成一棵新的二叉树,该新的二叉树的根节点的权值是前面两颗二叉树根节点权值的和。
4)再将这棵新的二叉树,以根节点的权值大小再次排序,不断重复上述步骤,直到所有数据都被处理,即可得到一颗哈夫曼树
package huffmantree;
import java.util.ArrayList;
import java.util.Collections;
public class HuffmanTree {
public static void main(String[] args) {
int arr[] = {13, 7, 8, 3, 29, 6, 1};
Node root = creatHuffmanTree(arr);
preOrder(root);
}
public static void preOrder(Node root) {
if(root != null) {
root.preOrder();
}else {
System.out.println("空树不可遍历");
}
}
public static Node creatHuffmanTree(int []arr) {
//第一步为了操作方便
//1.遍历arr数组
//2.将arr的每个元素构成一个node
//3.将node放入到arraylist中
ArrayList<Node> nodes = new ArrayList<Node>();
//list 和 arraylist 的区别
for(int value : arr) {
nodes.add(new Node(value));
}
//排序 从小到大
Collections.sort(nodes);
//为啥这个的输出如此美妙nodes = [Node[value=1], Node[value=3], Node[value=6], Node[value=7], Node[value=8], Node[value=13], Node[value=29]]
System.out.println("nodes = " + nodes);
while(nodes.size()>=2) {
//取出根结点权值最小的两棵二叉树
Node leftNode = nodes.get(0);
Node rightNode = nodes.get(1);
//构建一棵新的二叉树
Node parent = new Node(leftNode.value + rightNode.value);
parent.left = leftNode;
parent.right = rightNode;
nodes.remove(leftNode);
nodes.remove(rightNode);
//个人认为也可以直接remove 0 1
nodes.add(parent);
Collections.sort(nodes);
System.out.println("nodes = " + nodes);
}
return nodes.get(0);
}
}
//创建节点类
//为了让Node对象持续Collections集合排序
//让Node 实现Comparable接口
class Node implements Comparable<Node> {
int value;//结点权值
Node left;
Node right;
//写一个前序遍历
public void preOrder() {
System.out.println(this);
if(this.left != null) {
this.left.preOrder();
}
if(this.right != null) {
this.right.preOrder();
}
}
public Node(int value) {
this.value = value;
}
public String toString() {
return "Node[value=" + value + "]";
}
//从小到大排序,看一下comparable接口
public int compareTo(Node o) {
return this.value - o.value;
}
}
哈夫曼编码
1)哈夫曼编码是一种程序算法//什么是程序算法呢 我也不懂哈哈
2)哈夫曼编码是哈夫曼树在电讯通信中的经典的应用之一
3)广泛应用于数据文件压缩
//复习字节字比特ascii
原理剖析
=>通信领域中的信息处理方式1-定长编码:二进制所有长度相同
=>通信领域中的信息处理方式2-变长编码:统计个字符出现的次数 ,原则上字符出现的次数越多,编码越小。
=>通信领域中的信息处理方式3-哈夫曼编码:
1)传输的字符串是
i like like like java do you like a java
2)统计各个字符出现的次数
3)按照字符出现的次数构建哈夫曼树,次数作为权值
1 1 2 2 4 4 5 5 9
4)根据哈夫曼树,给各个字符规定编码
规定向左路径为0,向右路径为1
这是一种前缀编码 在匹配时不会出现多义性
5)按照上面的哈夫曼编码,可以得到字符串对应的编码
6)哈夫曼编码是一种无损压缩
注意思考:哈夫曼树根据排序方法不同,也可能不太一样 1 3 4 4 4 6 7 8
不过WPL是一样的
补充:
=>前缀编码:不能有二义性
哈夫曼编码树的创建
思路:
1)Node { data(存放数据),wight(存放权值),left 和 right }
2)得到对应的byte[ ]数组
3)编写一个方法,将准备构建哈夫曼树的Node结点放入List中
4)通过List创建对应的哈夫曼树