基于哈夫曼二叉树的文件压缩实现

本文介绍了如何使用哈夫曼二叉树实现文件压缩。通过建立哈夫曼树,得到字符的哈夫曼编码,将字符串转换为01串,并按8位存储为字节,有效压缩存储空间。在压缩过程中,还需要考虑码表的存储以便解压。文中提到的压缩流程包括读取文件字节、构建哈夫曼树、生成编码、存储码表和压缩字节,以及按照相反步骤解压。
摘要由CSDN通过智能技术生成

基于哈夫曼二叉树的文件压缩实现

上一篇博客中我们提到如何将一个字符串建立哈夫曼二叉树

那么我们实现文件压缩其实已经成功了一半

哈夫曼二叉树可以得到哈夫曼编码,哈夫曼编码具有不重复的特性,我们可以利用这一特性来实现压缩

获取哈夫曼编码的规则是:从根节点出发往左就+“0”,往右就+“1”直到找到叶子节点

获取哈夫曼编码的方法:

/*
	 * 此方法用来得到哈夫曼编码
	 */
	public void getBM(Node roo,String st){
		if((roo.getLeft()==null)&&(roo.getRight()==null)){
			str+=st;
			String q=str;
			roo.getStr();
			System.out.println(str);
		}
		if(roo.getLeft()!=null){
			getBM(roo.getLeft(), st+"0");
		}
		if(roo.getRight()!=null){
			getBM(roo.getRight(), st+"1");
		}
	}
    /*
	 * 此方法封装了getBM(Node roo,String st)用来得到哈夫曼编码
	 */
	public void getBM(){
		getBM(root, str);
	}

因为叶子节点都是存储的我们字符串中存在的字符,所以每个字符都能对应一个哈夫曼编码,我们只需要将字符串中的字符替换位哈夫曼编码,就能生成一组01串,然后将01串每隔8位存储为一个byte,就能大大的压缩存储空间

我们这时很大可能遇到最后一位8位01串不足8位时,将01

综合实验: 1. 问题描述 利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。这要求在发送端通过一个编码系统对待传输数据预先编码,在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站编写一个哈夫曼码的编/译码系统。 2. 基本要求 一个完整的系统应具有以下功能: (1) I:初始化(Initialization)。从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中。 (2) E:编码(Encoding)。利用已建好的哈夫曼树(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。 (3) D:译码(Decoding)。利用已建好的哈夫曼树将文件CodeFile中的代码进行译码,结果存入文件Textfile中。 (4) P:印代码文件(Print)。将文件CodeFile以紧凑格式显示在终端上,每行50个代码。同时将此字符形式的编码文件写入文件CodePrin中。 (5) T:印哈夫曼树(Tree printing)。将已在内存中的哈夫曼树以直观的方式(比如树)显示在终端上,同时将此字符形式的哈夫曼树写入文件TreePrint 中。 3. 测试数据 用下表给出的字符集和频度的实际统计数据建立哈夫曼树,并实现以下报文的编码和译码:“THIS PROGRAME IS MY FAVORITE”。 字符 A B C D E F G H I J K L M 频度 186 64 13 22 32 103 21 15 47 57 1 5 32 20 字符 N O P Q R S T U V W X Y Z 频度 57 63 15 1 48 51 80 23 8 18 1 16 1
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值