MPEG 学习笔记

最新推荐文章于 2022-02-04 00:30:43 发布

赢在未来5

最新推荐文章于 2022-02-04 00:30:43 发布

阅读量437

点赞数

分类专栏：日常学习笔记文章标签：计算机视觉

本文链接：https://blog.csdn.net/zxy5691419/article/details/106270891

版权

日常学习笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

MPEG 第二部分

视频对象的压缩格式

技术方案

支持的格式

MPEG-4 Visual支持以下格式和比特率：

比特率：通常在5 kbit / s至1 Gbit / s之间
逐行视频和隔行视频
不同的颜色采样格式（包括4：2：0、4：2：2和4：4：4）
分辨率：从sub-QCIF到Studio（4k x 4k像素）

压缩效率

压缩算法是混合编码（运动补偿预测和标量量化DCT系数编码的组合）。具体工具包括：

四分之一像素精度和可变块大小（8x8或16x16）可用于运动补偿；
全局运动补偿，允许仅使用少量参数来表达例如摄像机运动的影响；
可以选择不同的VLC表，其中将代码设计为在较低或较高速率范围内进行更有效的编码；选择由编码器控制，并取决于目标速率；
在短报头模式下，实现了与H.263基线语法的比特流级别兼容性；
直接模式可以通过从同位的P-VOP运动矢量推断出B-VOP内的运动矢量，而没有速率开销。
对于高质量的录音棚存储和录音棚间传输应用，介绍了一种不同的DCT系数编码方法[1]。这是基于将DCT系数按相似的幅度值进行分组的方式，而不是传统的之字形游程长度和电平组合的熵编码方案。在此功能中，将VLC表的递归选择应用于系数组，其中选择功能依赖于先前编码的组。编码数据是组指示符和确定实际编码值的固定长度代码。
对于高质量的录音棚存储，定义了一种基于DPCM和PCM之间切换的无损编码方法。

可伸缩性功能

编码器中的复杂度可伸缩性允许不同复杂度的编码器为给定的纹理，图像或视频生成有效且有意义的比特流。解码器中的复杂度可伸缩性允许给定的纹理，图像或视频比特流被复杂度不同的解码器解码。通常，重构的质量与所使用的解码器的复杂度有关。这可能需要功率较小的解码器仅解码一部分比特流。视频编解码器中定义的更具体的可伸缩性工具如下：

空间可伸缩性允许解码器解码由编码器生成的总比特流的子集，以降低的空间分辨率重建和显示纹理，图像和视频对象。
时间可伸缩性允许解码器解码由编码器生成的总比特流的子集，以降低的时间分辨率重建和显示视频。最多支持三个级别。
保真可伸缩性（也称为SNR可伸缩性）允许将比特流解析为多个不同比特率的比特流层，从而仍可以将这些层的子集的组合解码为具有相同空间和时间分辨率但有意义的信号较低的保真度。比特流解析可以在传输期间或在解码器中进行。通常，重建的质量与用于解码和重建的层数有关。

应用领域

基于帧的MPEG-4视频是一种格式，用于有效存储视频内容以及通过Internet和移动网络进行视频流传输，以及用于专业应用程序，例如工作室中的视频存储。

3D网格编码 3DMC

3DMC方案

3DMC包含三个主要的编码块：拓扑外科手术（数据转换）；连接性，几何形状和其他属性的差分量化（量化）；和熵编码。在图1中，展示了3DMC解码器架构。

在这里插入图片描述

功能性

3DMC提供30：1到40：1的压缩比，而没有明显的视觉下降。但是，压缩不是使用3DMC的唯一优势。3DMC支持以下功能：

压缩：支持3D模型的近乎无损到有损压缩。通常，在VRML ASCII文件上可以实现30：1到40：1的压缩比，而不会造成视觉效果下降。
增量渲染：使用3DMC，无需等待接收到完整的比特流就可以开始渲染。借助增量渲染功能，解码器可以仅使用整个比特流的一小部分开始构建模型。当延迟是关键问题时（例如对于家庭购物），此功能非常重要。
支持非歧管模型：由于使用3DMC拓扑外科手术具有压缩特性，因此仅支持可定向[1]和歧管[2]模型。对于非定向或非流形[3]模型，执行称为拼接的专用操作来支持这些模型。
支持错误恢复能力：3DMC具有内置的错误恢复能力，可以减少网络错误，因为解码器可以从不受错误破坏的分区中构建模型。
支持渐进式传输：3D网格模型可能非常复杂，具有数百万个多边形。取决于观看距离，用户可能不需要百万个三角形的精度，但可能对数百个三角形感到满意。与LOD（详细程度）表示类似的可伸缩位流允许构建具有不同分辨率的3D模型来满足这种情况。

赢在未来5

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
MPEG 学习笔记

MPEG 第二部分视频对象的压缩格式相关概念包含的技术有 2D图形编码二维视频编码 3D图形编码SO / IEC 14496-2指定了一种视频编解码器，该编解码器可以有效压缩矩形（基于帧）视频。支持多种应用，范围从移动视频传输所需的极低速率和分辨率到专业生产领域中适用的高速率，分辨率和保真度。还支持其他功能，例如可伸缩性和错误恢复能力。DCT（离散余弦变换，类似于离散傅里叶变换[DFT]）经常被信号处理和图像处理使用，用于信号和图像进行有损数据压缩。VOP (Video Object
复制链接

扫一扫