十七、熵编码_CABAC语法元素的二值化

一、上下文自适应的二进制算术编码

在上篇博文十六、算术编码_1、基本原理与实现,然而在实际的H.264编解码的方法中,显然是不可能采用上文中简单的算法来实现。

  • H.264采用的算术编码方法:
    • 上下文自适应的二进制算术编码(Context-based Adaptive Binary Arithmetic Coding, CABAC)
  • CABAC:
    • H264中首先采用的、专用于视频压缩编码的熵编码算法
    • 在视频编码的发展中保持了强大生命力,并在H265中保留继承
  • 在CABAC中,主要步骤或算法可以分为3个步骤/类别:
    • 语法元素的二值化: 残差数据不可能只有0、1,而是包含的非常广的取值范围的,所以需要将取值范围广泛的语法元素转化为0/1的二进制信息流
    • 语法元素的山下文: 维护每个语法元素在每次编码执行过程时的概率模型及其变化(概率模型是动态发生变化的)
    • 算法编码: 根据上下文给出的概率模型,将二值化的语法元素编码为码流。(这部分和上节的算术编码的原理基本一致)
  • 在H264的标准文档中,CABAC的解析方法定义于9.3节。
  • 在文档中使用cabac的语法元素以描述符ae(v)来标识
  • 对使用CABA
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
策略(Policy Entropy)是在强化学习中常用的一个概念,用来衡量策略的不确定性或多样性。它可以通过策略分布的对数概率(log probability)来计算。 在强化学习中,策略通常表示为一个概率分布,它描述了在给定状态下采取每个动作的概率。对于离散动作空间,策略可以表示为一个向量,其中每个元素表示对应动作的概率。而对于连续动作空间,策略通常通过参数化的概率分布来表示,比如高斯分布。 策略可以用来衡量策略的不确定性或多样性。越高,表示策略的分布越均匀,即策略对所有动作都给予了相似的概率,这意味着策略的多样性较高。而越低,表示策略的分布越集中在某些特定动作上,这意味着策略的多样性较低。 策略可以通过策略分布的对数概率来计算。具体而言,对于离散动作空间,策略可以用以下公式表示: H(p) = - ∑(p(a) * log(p(a))) 其中,p(a) 表示策略分布中选择动作 a 的概率,∑ 表示对所有动作求和。 对于连续动作空间,策略的计算稍有不同,通常需要对动作空间进行积分。常见的连续动作空间的策略计算方法包括高斯分布的公式。 策略在强化学习中起到了重要的作用。一方面,策略可以用来探索环境,通过增加策略的多样性,使得智能体在探索环境时能够更全面地尝试各种动作,从而更好地学习到环境的特征。另一方面,策略也可以用来作为正则化项,加入到强化学习的目标函数中,以平衡探索和利用的权衡,避免策略陷入局部最优解。 希望这个回答对你有帮助,如果还有其他问题,请随时提问!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值