讲一下什么是哈夫曼树。
哈夫曼树简称带权路径最小。
构建:
构建过程非常简单
1 3 5 10 12 18 25 (排好顺序了 没排的第一步排序)
然后取两个最小的数构建 原序列变成 4 5 10 12 18 25
然后在取最小的两个数构建 9 10 12 18 25
再取 19 12 18 25
再取 19 30 25
再取 44 30
最后 74 大概这样的过程 取的树拿出来作为构建的节点
编码:
编码的话,令左边树为0,右边为1
作用:
然后主要作用,很明显,大的数字靠近根节点,权重越大,哈夫曼编码越短。
官方解释:
在数据通信中,需要将传送的文字转换成二进制的字符串,用0,1码的不同排列来表示字符。例如,需传送的报文为“AFTER DATA EAR ARE ART AREA”,这里用到的字符集为“A,E,R,T,F,D”,各字母出现的次数为{8,4,5,3,1,1}。现要求为这些字母设计编码。要区别6个字母,最简单的二进制编码方式是等长编码,固定采用3位二进制,可分别用000、001、010、011、100、101对“A,E,R,T,F,D”进行编码发送,当对方接收报文时再按照三位一分进行译码。显然编码的长度取决报文中不同字符的个数。若报文中可能出现26个不同字符,则固定编码长度为5。然而,传送报文时总是希望总长度尽可能短。在实际应用中,各个字符的出现频度或使用次数是不相同的,如A、B、C的使用频率远远高于X、Y、Z,自然会想到设计编码时,让使用频率高的用短码,使用频率低的用长码,以优化整个报文编码。