赫夫曼树
- 满二叉树:除了叶子节点,其他的都有两个子节点,1 2 4 8这样的节点 2^n个点
- 完全二叉树:除了最底层都有两个子节点,而且叶子节点是靠左连续的;
- 计算下面三颗二叉树的带权路径长度总和:
其中每个点的权重为:a:7 b:5 c:2 d:4 - WPL(a):72+52+22+42=36()
WPL(b):73+53+21+42=46()
WPL©:71+52+23+43=35()
介绍
给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。
赫夫曼编码
在上图的最优二叉树中我们给每一条边加上一个权值,指向左子节点的边我们标记为0,指向右子节点的边标记为1,那从根节点
到叶节点的路径就是我们说的哈夫曼编码;
所以图c的赫夫曼树对应的编码就是:
电报加密
A:0
B:10
C:110
D:111
构建赫夫曼树
核心思想:贪心算法:利用局部最优推出全局最优,把频率出现多的用短码表示,频率出现小的就用长一点。而且,任何一个字符的编码都不是另一个的前缀,在解压缩的时候,我们每次会读取尽可能长的可解压的二进制串,所以在解压缩的时候也不会产生歧义。
- 具体实现思路:
1.每次取数值最小的两个节点,将之组成为一颗子树。
2.移除原来的两个点
3.然后将组成的子树放入原来的序列中
4.重复执行1 2 3 直到只剩最后一个点
代码实现
package com.DataConstruct.tree.HafuTree;
public class HfmNode implements Comparable<HfmNode>{ //优先队列,小的我把你优先级调高
String chars; //节点里面的字符
int fre; //表示是频率
HfmNode left;
HfmNode right;
HfmNode parent; //用来找上层的
@Override
public int compareTo(HfmNode o) {
return this.fre - o.fre;
}
}
package com.DataConstruct.tree.HafuTree;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.PriorityQueue;
public class HuffmenTree {
HfmNode root;
List<HfmNode> leafs; // 叶子节点
Map<Character, Integer> weights; // 叶子节点的权重, a,b,c,d,e
public HuffmenTree(Map<Character, Integer> weights) {
this.weights = weights;
leafs = new ArrayList<HfmNode>();
}
public Map<Character, String> code() {
Map<Character, String> map = new HashMap<Character, String>();
for (HfmNode node : leafs) {
String code = "";
Character c = new Character(node.chars.charAt(0)); // 叶子节点肯定只有一个字符
HfmNode current = node; // 只有一个点
do {
if (current.parent != null && current == current.parent.left) { // 说明当前点是左边
code = "0" + code;
} else {
code = "1" + code;
}
current = current.parent;
} while (current.parent != null); // parent == null就表示到了根节点
map.put(c, code);
System.out.println(c + ":" + code);
}
return map;
}
public void creatTree() {
Character keys[] = weights.keySet().toArray(new Character[0]); // 拿出所有的点
PriorityQueue<HfmNode> priorityQueue = new PriorityQueue<HfmNode>(); // jdk底层的优先队列
for (Character c : keys) {
HfmNode hfmNode = new HfmNode();
hfmNode.chars = c.toString();
hfmNode.fre = weights.get(c); // 权重
priorityQueue.add(hfmNode); // 首先把我们的优先队列初始化进去
leafs.add(hfmNode);
}
int len = priorityQueue.size();
for (int i = 1; i <= len - 1; i++) { // 每次找最小的两个点合并
HfmNode n1 = priorityQueue.poll(); //
HfmNode n2 = priorityQueue.poll(); // 每次取优先队列的前面两个 就一定是两个最小的
HfmNode newNode = new HfmNode();
newNode.chars = n1.chars + n2.chars; // 我们把值赋值一下,也可以不复制
newNode.fre = n1.fre + n2.fre; // 把权重相加
// 维护出树的结构
newNode.left = n1;
newNode.right = n2;
n1.parent = newNode;
n2.parent = newNode;
priorityQueue.add(newNode);
}
root = priorityQueue.poll(); // 最后这个点就是我们的根节点
System.out.println("构建完成");
}
public static void main(String[] args) {
// a:3 b:24 c:6 d:20 e:34 f:4 g:12
Map<Character, Integer> weights = new HashMap<Character, Integer>();
//一般来说:动态的加密,最开始是不知道里面有什么内容的。我们需要一个密码本,往往就是某个字典。如果是英文就用英文字典,统计次数。
//换密码本
//静态的文件。针对性的做编码.图像加密,没有特性的。hash加密(MD5)
weights.put('a', 3);
weights.put('b', 24);
weights.put('c', 6);
weights.put('d', 1);
weights.put('e', 34);
weights.put('f', 4);
weights.put('g', 12);
HuffmenTree huffmenTree = new HuffmenTree(weights);
huffmenTree.creatTree();
Map<Character, String> code = huffmenTree.code();
String str = "aceg";
System.out.println("编码后的:");
char s[] = str.toCharArray();
}
}