【图像编码】基于信息熵理论的端到端图像编码中熵编码的概率估计

繁星知微

于 2023-09-18 11:53:28 发布

阅读量397

点赞数 1

分类专栏：图像视频编码论文精读文章标签：视频编解码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43693967/article/details/132963814

版权

论文精读同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

图像视频编码

1 篇文章 0 订阅

订阅专栏

信息熵理论和概率模型

信息熵知识

$-\sum_{x \in X} \log P(x)$ ，表示X的不确定性
$-\sum_{x \in X} \sum_{y \in Y} P(x, y) \log{P(y|x)}$ ，表示在已知 X 的情况下，Y 的不确定性。
$联合熵： H (X, Y) = H (X) + H (Y ∣ X) = H (Y) + H (X ∣ Y)$
$互信息： I (X; Y) = H (X) + H (Y) - H (X, Y) = H (X) - H (X ∣ Y) = H (Y) - H (Y ∣ X)$
如果X与Y独立，则互信息为0
在这里插入图片描述
参考文章：信息论（3）——联合熵，条件熵，熵的性质

简单理解条件熵：条件越多，事件的不确定性就越小，熵就越小

概率模型

采用的是均值为0，方差为 $\sigma$ 的高斯概率模型

高斯概率模型公式（正态分布模型）:
$=\frac{1}{\sqrt{2{\pi}{\sigma}^2}} e^{-\frac{(x-{\mu})^2}{2{\sigma}^2}}$
其中， $x$ 是随机变量的取值， $\mu$ 是均值（期望）， $\sigma$ 是标准差。公式中的 $e$ 是自然对数的底数

深度学习熵编码演进

1. 2017 Factorized Prior（独立熵编码）

[1] Ballé, Johannes, et al. “End-to-end optimized image compression.” in ICLR. 2017.

下式为估计的平均码长。
只有概率估计的越准，才能逼近平均码长的理论下限值—— $\hat{y}$ 的独立熵在这里插入图片描述

在这里插入图片描述

2. 2018 Scale Hyper Prior（条件熵编码）

[2] Ballé, Johannes, et al. “Variational image compression with a scale hyperprior.” in ICLR. 2018.

这篇工作其实是利用 $\hat{y}$ 的条件概率来编码 $\hat{y}$ ，条件概率进一步挖掘了 $\hat{y}$ 空间相关性，此时平均码长的理论下限值是—— $\hat{y}$ 的条件熵

在这里插入图片描述

在这里插入图片描述

3. 2018 Joint Autoregressive Hierarchical Prior

[3] Minnen, David, et al. “Joint autoregressive and hierarchical priors for learned image compression.” in NeruIPS. 2018.

Auto-encoder：学习量化的图像隐式特征，称为latent
概率估计模块：学习量化后的latent的概率模型用于熵编码
- Context model(上下文模型)：latent的上下文自回归模型。利用的是已解码的数据，当前解码字符之前的（<i）
- Hyper-network（超先验网络）：学习有用的表征信息来修正上下文预测
- Entropy Parameters network（熵参数网络）:结合上面两个模块的信息来生成条件高斯熵模型的参数（均值+方差）

理解context model中的两根线

从Q出来的线：编码时用的 $\hat{y}_{<i}$
从AD出来的线：解码时用的 $\hat{y}_{<i}$

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【图像编码】基于信息熵理论的端到端图像编码中熵编码的概率估计

独立熵：HX−∑x∈XlogPx，表示X的不确定性条件熵：HY∣X−∑x∈X∑y∈YPxylogPy∣x，表示在已知 X 的情况下，Y 的不确定性。联合熵：HXYHXHY∣XHYHX∣Y互信息：IX;YHXHY−HXYHX−HX∣YHY−HY∣X如果X与Y独立，则互信息为0简单理解条件熵：条件越多，事件的不确定性就越小，熵就越小。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

繁星知微 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。