数据结构与算法【基础版】:4.18 数据压缩之创建编码表&编码

4.18 数据压缩之创建编码表&编码

上节回顾:

在这里插入图片描述

代码演示:

TestHuffmanCode .java

package main.java.com.LiKou.demo10;

import java.util.*;

public class TestHuffmanCode {
    public static void main(String[] args) {
        String msg = "can you can a can as a can canner can a can.";
        byte[] bytes = msg.getBytes();
        //进行赫夫曼编码压缩的方法
        byte[] b = huffmanZip(bytes);
        System.out.println("压缩前:" + bytes.length);
        System.out.println("压缩后:" + b.length);
    }

    /**
     * 这是对赫夫曼数的压缩
     * @param bytes
     * @return
     */
    private static byte[] huffmanZip(byte[] bytes) {
        //先统计每个byte出现的次数,并放入一个集合中
        List<Node> nodes = getNodes(bytes);
        //创建一棵赫夫曼树
        Node tree = createHuffmanTree(nodes);
        System.out.println(tree);//测试赫夫曼树的正确性
        System.out.println(tree.left);//测试赫夫曼树的左子树
        System.out.println(tree.right);//测试赫夫曼树的右子树
        //创建一个赫夫曼编码表
        Map<Byte, String> huffCodes = getCodes(tree);
        System.out.println(huffCodes);
        //编码
        byte[] b = zip(bytes, huffCodes);
        return b;
    }

    /**
     * 进行赫夫曼编码
     * @param bytes
     * @param huffCodes
     * @return
     */
    private static byte[] zip(byte[] bytes, Map<Byte, String> huffCodes) {
        StringBuilder sb = new StringBuilder();
        //把需要压缩的byte数组处理成一个二进制的字符串
        for (byte b : bytes) {
            sb.append(huffCodes.get(b));
        }
        //定义长度
        int len;
        if(sb.length() % 8 == 0){
            len = sb.length() / 8;
        }else {
            len = sb.length() / 8 + 1;  //除不尽的时候剩下的+1
        }
        //用于存储压缩后的byte
        byte[] by = new byte[len];
        //记录新的byte位置
        int index = 0;
        for(int i = 0; i < sb.length(); i+=8){
            String strByte;
            if(i + 8 > sb.length()){
                strByte = sb.substring(i);
            }else {
                strByte = sb.substring(i, i + 8);
            }
            byte byt = (byte)Integer.parseInt(strByte, 2);
            by[index] = byt;
            index++;
        }
        return by;
    }

    //用于临时存储路径
    static StringBuilder sb = new StringBuilder();
    //用于存储赫夫曼编码
    static Map<Byte, String> huffCodes = new HashMap<>();
    /**
     * 根据赫夫曼树获取赫夫曼编码
     * @param tree
     * @return
     */
    private static Map<Byte, String> getCodes(Node tree) {
        if(tree == null){
            return null;
        }
        getCodes(tree.left, "0", sb);
        getCodes(tree.right, "1", sb);

        return huffCodes;
    }

    private static void getCodes(Node node, String code, StringBuilder sb) {
        StringBuilder sb2 = new StringBuilder(sb);
        sb2.append(code);
        if(node.data == null){  //就不是叶节点,递归处理
            getCodes(node.left, "0", sb2);
            getCodes(node.right, "1", sb2);
        }else { //就是叶节点,需要存起来
            huffCodes.put(node.data, sb2.toString());
        }
    }

    /**
     * 用来创建赫夫曼树的
     * @param nodes
     * @return
     */
    private static Node createHuffmanTree(List<Node> nodes) {
        while (nodes.size() > 1){
            //排序需要再Node类上实现Comparable——这个类才能进行排序(倒序,小的在前面)
            Collections.sort(nodes);
            //取出两个权值最低的二叉树
            Node left = nodes.get(nodes.size() - 1);
            Node right = nodes.get(nodes.size() - 2);
            //创建一棵新的二叉树
            Node parent = new Node(null, left.weight + right.weight);
            //把之前取出来的两棵二叉树设置为新创建的二叉树的子树
            parent.left = left;
            parent.right = right;
            //把前面取出来的两棵二叉树删除
            nodes.remove(left);
            nodes.remove(right);
            //把新创建的二叉树放入集合中
            nodes.add(parent);
        }
        return nodes.get(0);
    }

    /**
     * 把byte数组转为node集合
     * @param bytes
     * @return
     */
    private static List<Node> getNodes(byte[] bytes) {
        List<Node> nodes = new ArrayList<>();
        //存储每一个byte出现了多少次
        Map<Byte, Integer> counts = new HashMap<>();
        //统计每一个byte出现的次数
        for(byte b : bytes){
            Integer count = counts.get(b);
            if(count == null){
                counts.put(b, 1);
            }else {
                counts.put(b, count + 1);
            }
        }

        ///把每一个键值对转为一个node对象
        for(Map.Entry<Byte, Integer> entry : counts.entrySet()){
            nodes.add(new Node(entry.getKey(), entry.getValue()));
        }
        return nodes;
    }
}

结果:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

狂野小白兔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值