哈夫曼编码.m

clc;close;clear;
p=input('please input a number:')  %提示输入界面eg:[0.32 0.18 0.05 0.10 0.15 0.2]
n=length(p);
for i=1:n
    if  p(i)<0
        fprintf('\n The probabilities in huffman can not less than 0!\n');
        p=input('please input a number:')  %如果输入的概率数组中有小于0的值,则重新输入概率数组
    end
end
if  abs(sum(p)-1)>0
    fprintf('\n The sum of the probabilities in huffman can more than 1!\n');
    p=input('please input a number:')   %如果输入的概率数组总和大于1,则重新输入概率数组
end
q=p;
a=zeros(n-1,n);                       %生成一个n-1行n列的数组
for i=1:n-1
    [q,l]=sort(q)             %对概率数组q进行从小至大的排序,并且用l数组返回一个数组,该数组表示概率数组q排序前的顺序编号
    a(i,:)=[l(1:n-i+1),zeros(1,i-1)]      %由数组l构建一个矩阵,该矩阵表明概率合并时的顺序,用于后面的编码
    q=[q(1)+q(2),q(3:n),1];           %将排序后的概率数组q的前两项,即概率最小的两个数加和,得到新的一组概率序列
end
for i=1:n-1
    c(i,1:n*n)=blanks(n*n);     %生成一个n-1行n列,并且每个元素的的长度为n的空白数组,c矩阵用于进行huffman编码,并且在编码中与a矩阵有一定的对应关系
end
c(n-1,n)='0';           %由于a矩阵的第n-1行的前两个元素为进行huffman编码加和运算时所得的最
c(n-1,2*n)='1';          %后两个概率,因此其值为0或1,在编码时设第n-1行的第一个空白字符为0,第二个空白字符1。
for i=2:n-1
    c(n-i,1:n-1)=c(n-i+1,n*(find(a(n-i+1,:)==1))-(n-2):n*(find(a(n-i+1,:)==1)))  %矩阵c的第n-i的第一个元素的n-1的字符赋值为对应于a矩阵中第n-i+1行中值为1的位置在c矩阵中的编码值
    
    c(n-i,n)='0'                %根据之前的规则,在分支的第一个元素最后补0
    c(n-i,n+1:2*n-1)=c(n-i,1:n-1)  %矩阵c的第n-i的第二个元素的n-1的字符与第n-i行的第一个元素的前n-1个符号相同,因为其根节点相同
    c(n-i,2*n)='1'               %根据之前的规则,在分支的第一个元素最后补1
    for j=1:i-1
        c(n-i,(j+1)*n+1:(j+2)*n)=c(n-i+1,n*(find(a(n-i+1,:)==j+1)-1)+1:n*find(a(n-i+1,:)==j+1)) %矩阵c中第n-i行第j+1列的值等于对应于a矩阵中第n-i+1行中值为j+1的前面一个元素的位置在c矩阵中的编码值
    end
end                       %完成huffman码字的分配
for i=1:n
    h(i,1:n)=c(1,n*(find(a(1,:)==i)-1)+1:find(a(1,:)==i)*n)  %用h表示最后的huffman编码,矩阵h的第i行的元素对应于矩阵c的第一行的第i个元素
    ll(i)=length(find(abs(h(i,:))~=32))        %计算每一个huffman编码的长度
end
l=sum(p.*ll);         %计算平均码长
fprintf('\n huffman code:\n');
h
hh=sum(p.*(-log2(p)));        %计算信源熵
fprintf('\n the huffman effciency:\n');
t=hh/l                      %计算编码效率

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
 哈夫曼编码(Huffman Coding)是一种编码方式,哈夫曼编码是可变字长编码(VLC)的一种。 Huffman于1952年提出一种编码方法,该方法完全依据字符出现概率来构造异字头的平均长 度最短的码字,有时称之为最佳编码,一般就叫作Huffman编码。 以哈夫曼树─即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。 在计算机信息处理中,“哈夫曼编码”是一种一致性编码法(又称"熵编码法"),用于数据的无损耗压缩。这一术语是指使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。这种方法是由David.A.Huffman发展起来的。 例如,在英文中,e的出现概率很高,而z的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时,e极有可能用一个位(bit)来表示,而z则可能花去25个位(不是26)。用普通的表示方法时,每个英文字母均占用一个字节(byte),即8个位。二者相比,e使用了一般编码的1/8的长度,z则使用了3倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算,就可以大幅度提高无损压缩的比例。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值