【视频编解码-08】详说熵编码--哈夫曼编码

最新推荐文章于 2024-08-08 21:01:13 发布

乱红飞

最新推荐文章于 2024-08-08 21:01:13 发布

阅读量1.6k

点赞数

分类专栏：音视频文章标签：视频编码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jobbofhe/article/details/114964056

版权

音视频专栏收录该内容

12 篇文章 7 订阅

订阅专栏

信息熵

信息论中，Shannon 他老人家发明了信息熵。
公式如下，它代表了信源S的熵：
在这里插入图片描述

单位：Bit/字符
那信息熵到底是什么呢？它是信息量的度量单位。不要再去想什么不确定性了，抽象的让人想去抽它，就认为它是信息的多样性吧，它的实际意义有两个：

信源S的平均信息量
编码所有符号S平均所需要的位数
那什么是熵编码？在信息熵的极限范围内进行编码就是熵编码。例如信息熵算出来是3bit/字符，你用4bit/字符来编码，就是熵编码，你用2bit/字符来编码，就不叫熵编码，因为这种情况下，就失真了嘛。
从这里也看以看出，信源熵是编码这个信源平均所需要的最小位数。
所以，熵编码是无损压缩。

一段视频序列，原始信号总是有冗余的，这种冗余成为表示冗余，如果能找到最短的一段数据来表示整段视频所表示的数据量，那么折断最短的数据就是熵。
熵编码的基本思想就是大概率的符号分配短的码字，小概率的符号分配长的码字。最终使得信源平军码长最短。
哈夫曼编码可以唯一正确解码，因为任何一个哈夫曼码字都不是其他码字的前缀。

熵编码有很多种：
哈夫曼编码（Huffman）
算术编码
行程编码（RLE）
基于上下文的自适应变长编码（CAVLC）
基于上下文的自适应二进制算术编码（CABAC）

哈夫曼编码

哈夫曼编码是变长编码的一种，依赖于码字的概率来构造平均长度最短的编码方法；
关键步骤：建立符合哈夫曼编码规则的二叉树，即哈夫曼树；
哈夫曼树：

一种特殊的二叉树，叶结点个数等于码元数，且每个终端节点带有各自的权值；
加权路径长度，即根结点到叶结点的路径长度乘以权值的总和最小
注意：在保存编码过后，huffman编码的码表也要保存。不同的信源，每个符号的编号是不同的！没有码表就无法进行解码。

有关哈夫曼编码在数据结构预算法专栏中的文章【【DSA】树-哈弗曼树详解（3）】已经说了详细的过程。

哈夫曼的缺点

解码器需要知道哈夫曼树的结构，因而编码器必须为解码器保存或者传输哈夫曼编码树，增加存储空间的要求；
传统的哈夫曼码字解码方式是从码流中依次读入比特，直到哈夫曼树中搜索到相应码字，这种方法增加了解码器计算的复杂度；

视频压缩系统的总体效率的提高依赖于系统中各项技术模块的性能增益。尽管预测编码和变换编码都能都有效的去除视频数据的冗余，但是真正实现压缩效果的是熵编码技术。在视频压缩系统中，熵编码总是位于系统的末端，负责对编码过程中产生的变换系数、运动矢量等信息进行信息编码，并完成最终压缩码流的组织。

除了DCT系数的熵编码外，在现代的基于块运动补偿的视频压缩系统中，熵编码还负责对运动矢量等辅助信息进行编码，但是在多数应用情况下，变换系数的编码比特栈总体码流的大部分，因此大部分视频熵编码技术的研究集中在变换系数的编码上。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

乱红飞 CSDN认证博客专家 CSDN认证企业博客

码龄9年

183: 原创

3万+: 周排名

143万+: 总排名

60万+: 访问

: 等级

5802: 积分

206: 粉丝

271: 获赞

162: 评论

808: 收藏

私信

关注

热门文章

分类专栏

Tensorflow 3篇
Framework
操作系统 5篇
Deep Learning 8篇
计算机系统 1篇
DirectX3D 14篇
C/C++ 34篇
音视频 12篇
CUDA 4篇
数据结构与算法 17篇
人工智能 12篇
软件配置 19篇
git 1篇
GCC 1篇
linux 19篇
Windows/VS开发经验 2篇
计算机视觉 8篇
机器学习 1篇
python 17篇
网络 1篇
数据库 2篇
人文 2篇
感悟 1篇
大佬言论 2篇
读书 4篇

最新评论

ONNX 结构分析
乱红飞: 首先，明确一点，就是图上的 A、B、Y表示占位符，一般的， A /B 表示 input tensor， Y 表示输出的 tensor; 问题1： B = 16，表示 mul 的第二个输入 shape 是 [16]; B<1x3x1x1x2> 这个也表示 tensor 的shape 信息；问题2：如果有明确的指数一般会有一个 const 的节点作为输入；或者是被记录在 attribute 上；Y = 2, 应该表示输出的 shape. 问题3：同1，这是表示 add 算子的第二个输入的shape是 [1x1x80x80x2] 所有上述问题你都可以到 onnx 源码中找到对应的解释；如果还有不确定的问题，可以直接参考源码：https://github.com/onnx/onnx
ONNX 结构分析
lmw0320: 我想请教几个问题： 1. onnx中mul算子显示只有一个B=16，这个是代表bias的形状还是什么？有时候显示是：B<1x3x1x1x2> ，又没有看到=号，这个又是怎么回事呢？ 2. pow算子应该需要明确其指数值，我从图中看到的是Y=2。这个Y是指数么？ 3. Add算子中，也是显示一个参数B<1x1x80x80x2>，这个B又是什么含义呢？
Boa服务器移植到嵌入式开发板上
乱红飞: 内容有点久远，我都忘记了，缺少声明，你耐心检查一下代码是不是缺少声明或者是版本不对。
Boa服务器移植到嵌入式开发板上
DaiHaoJTR: make后，报y.tab.c缺少yylex申明
CRT终端标签显示绝对路径
etny: 备注：可以从其他服务器上复制 .bashrc文件，然后 source ~/.bashrc

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。