哈夫曼树的编码原理及实战分析

本文详细介绍了哈夫曼编码的原理及其在字符串编码优化中的应用。通过一个具体的例子展示了如何利用哈夫曼树对不同频率的字符进行编码,以最小化存储空间。文章还提供了Java代码实现哈夫曼树的构建过程,并给出了编码后的结果。
摘要由CSDN通过智能技术生成

今天我们分享哈夫曼树的编码原理及实战:

首先我们通过一道面试题来引出哈夫曼树,试题如下:

问题:给定一段字符串,如何对字符串进行编码,可以使得该字符串的编码存储空间最少?

【例子】假设一段文本,包含58个字符,并且由以下7个字符构成:a,b,c,d,e,f,g;这7个字符出现的频次不同,如何对这7个字符进行编码,使得总编码空间最小。

字符

a

b

c

d

e

f

g

频次

10

15

12

3

4

13

1

一、、 常见解决思路:

1、【分析】

1)用等长ASCII编码:58×8=464位;

2)用等长3位编码:58×3=174位;

3)不等长编码:出现频次高的字符用的编码短些,出现频次低的编码长些。

【编码长度】 10×3+15×2+12×2+3×5+4×4+13×2+1×5=146位;

字符

a

b

c

d

e

f

g

频次

10

15

12

3

4

13

1

编码长度

3

2

2

5

4

2

5

 

3、使用二叉树解决编码问题:

使用二叉树如何进行编码?

1)二叉左右分支:0、1

2)字符随便放?

4个频次最高的字符:

字符

a

b

c

f

频次

10

15

12

13

1011是什么字符串的编码呢?可能代表如下结果,如下图:

1 0 1 1

f b f f  

1 0 1 1

f b a

1 0 1 1

c a

 如何避免二义性?

字符只在叶节点上(就不会有二义性),即只代表一种结果:

1 0 1 1

f b

解决方案如同:

4、

5、

二、使用哈夫曼树的解决方案:

1、什么是哈夫曼树:

哈夫曼树: 构造一棵二叉树,该树的带权路径长度达到最小, 称为最优二叉树,也称为哈夫曼树(Huffman Tree)。

2、构造哈夫曼树方式

1)每次把权值最小的两棵二叉树合并。

2)左节点权值比右节点小。

3、如上面试题的解决方案:

字符

a

b

c

d

e

f

g

频次

10

15

12

3

4

13

1

编码

111

10

00

11011

1100

01

11010

【编码长度】 10×3+15×2+12×2+3×5+4×4+13×2+1×5=146位;

 

4、编码流程图演示:绿色节点是两个子节点的合并,里面没有具体值。

1)首次组合:最小频次的两个

2)第二次组合,依次取最小的频次的数据

3)第三次构造,按照次思路继续操作

4)第四步流程:

5)第五步流程

6)第六步后完成编码

5、用java代码实现此树的编码:

public class NandaoHuffmanTree{
    //节点
    public static class Node<E> {
        E data; //数据
        int weight; //权重
        Node leftChild; //左子节点
        Node rightChild;//右子节点

        public Node(E data, int weight) {
            super();
            this.data = data;
            this.weight = weight;
        }

        public String toString() {
            return "Node[" + weight + ",data=" + data + "]";
        }
    }

    public static void main(String[] args) {
        List<Node> nodes = new ArrayList<Node>();
        //把节点加入至list中
        nodes.add(new Node("a", 10));
        nodes.add(new Node("b", 15));
        nodes.add(new Node("c", 12));
        nodes.add(new Node("d", 3));
        nodes.add(new Node("e", 4));
        nodes.add(new Node("f", 13));
        nodes.add(new Node("g", 1));
        //进行哈夫曼树的构造
        Node root = NandaoHuffmanTree.createTree(nodes);
        //打印哈夫曼树
        printTree(root);
    }

    /**
     * 构造哈夫曼树
     *
     * @param nodes
     *            节点集合
     * @return 构造出来的哈夫曼树的根节点
     */
    private static Node createTree(List<Node> nodes) {
        //如果节点node列表中还有2个和2个以上的节点
        while(nodes.size()>1){
            //什么是最小的,list表进行排序,增序的方式, 0,1,
            sort(nodes);//排序方式是增序的
            Node left = nodes.get(0);//权重最小的
            Node right = nodes.get(1);//权重第二小的
            //生成一个新的节点(父节点),父节点的权重为两个子节点的之和
            Node parent = new Node(null,left.weight+right.weight);
            //树的连接,让子节点与父节点进行连接
            parent.leftChild = left;
            parent.rightChild = right;
            nodes.remove(0);//删除最小的
            nodes.remove(0);//删除第二小的。
            nodes.add(parent);
        }
        return nodes.get(0); //返回根节点
    }
    /**
     * 冒泡排序,用于对节点进行排序(增序排序)
     *
     * @param nodes
     */
    public static void sort(List<Node> nodes) {
        if (nodes.size() <= 1)
            return ;
        /*循环数组长度的次数*/
        for (int i = 0; i < nodes.size(); i++){
            /*从第0个元素开始,依次和后面的元素进行比较
             * j < array.length - 1 - i表示第[array.length - 1 - i]
             * 个元素已经冒泡到了合适的位置,无需进行比较,可以减少比较次数*/
            for (int j = 0; j < nodes.size() - 1 - i; j++){
                /*如果第j个节点比后面的第j+1节点权重大,交换两者的位置*/
                if (nodes.get(j + 1).weight < nodes.get(j).weight) {
                    Node temp = nodes.get(j + 1);
                    nodes.set(j+1,nodes.get(j));
                    nodes.set(j,temp);
                }
            }
        }
        return ;
    }

    /*
     * 递归打印哈夫曼树(先左子树,后右子树打印)
     */
    public static void printTree(Node root) {
        System.out.println(root.toString());
        if(root.leftChild !=null){
            System.out.print("left:");
            printTree(root.leftChild);
        }
        if(root.rightChild !=null){
            System.out.print("right:");
            printTree(root.rightChild);
        }
    }
}

6、执行结果:

 到此哈夫曼树的编码原理及实战分析完成,下篇分析平衡二叉树,敬请期待!

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

寅灯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值