哈夫曼树算法压缩文件

今天上午上了哈夫曼算法压缩的课,我学习到了用哈夫曼算法压缩文件,可以将一个文件压缩百分之六十左右的大小。

具体原理是:文件是由一个个字节组成,而字节有自己的ASCII码值,然后用一个整形数组把文件的ASCII码值记下来,出现了一个就在其对应的ASCII值得int数组下标加一。然后用哈夫曼算法处理这个整形数组,得到哈夫曼编码值,然后读入文件的哈夫曼编码值,最后写入压缩文件。

哈夫曼压缩需要三个容器,一个是存数据字节,一个是哈夫曼节点,一个是存哈夫曼编码

代码如下:

private int[] data = new int[256];
	private LinkedList<HuffmNode> list = new LinkedList<HuffmNode>();
	private String[] codestr = new String[256];
	//代码块:让哈夫曼编码置为空字符串
	{
		for(int i=0;i<codestr.length;i++){
			codestr[i] = "";
		}
	}

压缩文件分五个步骤执行:

public static void main(String[] args) {
		Compress com = new Compress();
		//1.读取源文件,统计每个字节出现次数
		com.datatime();
		//2.构建哈夫曼节点
		com.creatNode();
		//3.构建哈夫曼树
		com.creatHuffmTree();
		//4.得到哈夫曼编码
		com.getCode(com.list.get(0),"");
		//5.再次读入文件的哈夫曼编码,并写入压缩文件(保存数据顺序,用于解压);
		com.writeFile();
	}

具体方法代码如下:

public void datatime(){
		try {
			//文件输入流读取test.txt文件
			FileInputStream fis = new FileInputStream("C:\\Users\\asus\\Desktop\\test.txt");
			int value = fis.read();
			while(value!=-1){
				data[value] ++;
				value = fis.read();
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

创建节点、哈夫曼树和构造哈夫曼编码和上一个博客一样,略。

<span style="font-size:24px;">//压缩文件的实现
	public void writeFile(){
		//1.读文件,得到编码串
		try {
			FileOutputStream fos = new FileOutputStream("C:\\Users\\asus\\Desktop\\test.zip");
			FileInputStream fis = new FileInputStream("C:\\Users\\asus\\Desktop\\test.txt");
			int value = fis.read();
			String str = "";
			while(value!=-1){
				String c = codestr[value];
				str = str + c ;
				value = fis.read();
			}
			//2.压缩结果写入压缩文件
			while(str.length()>=8){
				String s = str.substring(0,8);
				int v = StringToInt(s);
				fos.write(v);
				fos.flush();
				str = str.substring(8);	//截取从第八位字节后面的字节数
			}
			//3.把最后一点字节写出去
			int zero = 8 - str.length();
			for(int i=0;i<zero;i++){
				str = str + "0";
			}
			int v = StringToInt(str);
			fos.write(v);
			fos.flush();
			//4.把补零个数写入文件
			fos.write(zero);
			fos.flush();
			fis.close();
			fos.close();
		} catch (Exception e) {
			e.printStackTrace();
		}
	}</span>
这里涉及到了八位字符串转成int型的方法:

public int StringToInt(String s){
		int c1 = (int)s.charAt(0)-48;
		int c2 = (int)s.charAt(1)-48;
		int c3 = (int)s.charAt(2)-48;
		int c4 = (int)s.charAt(3)-48;
		int c5 = (int)s.charAt(4)-48;
		int c6 = (int)s.charAt(5)-48;
		int c7 = (int)s.charAt(6)-48;
		int c8 = (int)s.charAt(7)-48;
		int result = c8*1+c7*2+c6*4+c5*8+c4*16+c3*32+c2*64+c1*128;
		return result;
	}

下面是程序操作的结果(图):






这就是今天所学到的哈夫曼压缩,明天就学习哈夫曼解压了,加油! 奋斗 奋斗 奋斗



综合实验: 1. 问题描述 利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。这要求在发送端通过一个编码系统对待传输数据预先编码,在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站编写一个哈夫曼码的编/译码系统。 2. 基本要求 一个完整的系统应具有以下功能: (1) I:初始化(Initialization)。从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中。 (2) E:编码(Encoding)。利用已建好的哈夫曼树(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。 (3) D:译码(Decoding)。利用已建好的哈夫曼树将文件CodeFile中的代码进行译码,结果存入文件Textfile中。 (4) P:印代码文件(Print)。将文件CodeFile以紧凑格式显示在终端上,每行50个代码。同时将此字符形式的编码文件写入文件CodePrin中。 (5) T:印哈夫曼树(Tree printing)。将已在内存中的哈夫曼树以直观的方式(比如树)显示在终端上,同时将此字符形式的哈夫曼树写入文件TreePrint 中。 3. 测试数据 用下表给出的字符集和频度的实际统计数据建立哈夫曼树,并实现以下报文的编码和译码:“THIS PROGRAME IS MY FAVORITE”。 字符 A B C D E F G H I J K L M 频度 186 64 13 22 32 103 21 15 47 57 1 5 32 20 字符 N O P Q R S T U V W X Y Z 频度 57 63 15 1 48 51 80 23 8 18 1 16 1
哈夫曼是一种常用的压缩方法。是1952年为文本文件建立的,其基本原理是频繁使用的数据用较短的代码代替,很少使用的数据用较长的代码代替,每个数据的代码各不相同。这些代码都是二进制码,且码的长度是可变的。如: 有一个原始数据序列,ABACCDAA则编码为A(0),B(10),C(110),(D111),压缩后为010011011011100。产生霍夫曼编码需要对原始数据扫描两遍,第一遍扫描要精确地统计出原始数据中的每个值出现的频率,第二遍是建立霍夫曼树并进行编码,由于需要建立二叉树并遍历二叉树生成编码,因此数据压缩和还原速度都较慢,但简单有效,因而得到广泛的应用。 哈夫曼编码是无损压缩当中最好的方法。它使用预先二进制描述来替换每个符号,长度由特殊符号出现的频率决定。常见的符号需要很少的位来表示,而不常见的符号需要很多为来表示。哈夫曼算法在改变任何符号二进制编码引起少量密集表现方面是最佳的。然而,它并不处理符号的顺序和重复或序号的序列 哈夫曼压缩,首先用ASCII值初始化511个哈夫曼节点,然后,计算在输入缓冲区数据中,每个ASCII码出现的频率。然后,根据频率进行排序,现在,构造哈夫曼树,获取每个ASCII码对应的位序列,构造哈夫曼树,将所有的节点放到一个队列中,用一个节点替换两个频率最低的节点,新节点的频率就是这两个节点的频率之和。这样,新节点就是两个被替换节点的父节点了。如此循环,直到队列中只剩一个节点(树根)。压缩的最后一步是将每个ASCII编码写入输出缓冲区中 哈夫曼解压缩,将输入缓冲区中的每个编码用对应的ASCII码逐个替换就可以了。只要记住,这里的输入缓冲区是一个包含每个ASCII值的编码的位流。因此,为了用ASCII值替换编码,我们必须用位流搜索哈夫曼树,直到发现一个叶节点,然后将它的ASCII值添加到输出缓冲区中: 复制内容到剪贴板
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值