视频编解码原理



   视频编解码

       视频编解码技术首先要实现视频信号的数字化。视频是以幅幅图像组成,所以视频编解码首先要从图像编解码开始。我们常见的电视图像是由多个光点组合而成,电视机利用R(红),G(绿),B(蓝)三色不同比例的混合来表示各种色彩,从而实现视频信号点对点的转化,在实际中,我们将RGB信号按一定比例组合成Y(亮度),色度(U,V)信号,它们之间的关系为:

                       Y = 0.3R+0.59G+0.11B

                       U = B-Y;

                       V = R-Y;


   视频信号数字化

       模拟信号通常在时间和数值上都是连续的,从信息理论的角度来看, 模拟信号中包含的信息数量是无限的,数字化是将信息内容减少到一种合理层次的方法,它通常保留所考虑的信号的某些代表值而做到这一点,它从两方面完成这个工作,即在时间和幅度上取样。

     结合数字视频也包括两方面的内容,即空间位置的离散和数字化以及亮度电平值的离散和数字化,这就涉及到视频信号的扫描,取样,量化和编码。

    

1.扫描    

要想通过电信号来传输一幅图像,必须对图像进行扫描,从而将二维平面图像转换为一电信号表示。为了将二维图像空间所覆盖面积上的每一个最小单位面积都照顾到,扫描过程都是按从左到右、从上到下的顺序进行,这与人们在阅读书籍时一行一行地看文字是一样的。

在进行扫捕时,扫描头从图像的左上角开始沿水平方向移动到图像的右端,完成一各扫描行,然后再快速返回到下一行的开始点,开始第二个扫描行,依此继续,直到扫描完整幅图像,这种扫描方式称为逐行扫描。绝大多数计算机显示器都是采用逐行扫描方式.医用“B超”之类的应用电视系统也是采用了逐行扫描方式。所有逐行扫描行的集合称之为帧。由于扫描过程是连续的,因此逐行扫描得到的图像具有较高的清晰度。    

现行电视系统选用了隔行扫描方式,在这种方式下,扫描不是逐行进行,而是隔一行后再扫描下一行。隔行扫描行的集合称之为场。由于一场扫描仅得到逐行扫描所对应的一半的扫描行,因此,一场图像的清晰度显然不如一帧图像清晰度高,而随后的下一场扫描显然应该对本场刚刚没有扫描过的那些行来进行,由此提出奇数场和偶数场的概念。不难想象,一帧完整的图像应该由奇、偶两场组成,它们在时间上有一段延时,但在空间上却相互补充,利用人眼的视觉惰性,给人留F完整帧的印象。因此,当拍摄极快速运动的物体时,就会在屏幕上显示的运动物体的边缘看到“拖影”或“拉道”现象,这是因为偶场扫描线在填补奇场扫描线空档的时候延时了20ms,而此时物体已经发生的较大的位移。现行视频监控系统之所以选用了隔行扫描方式,主要是为了减少信号的频带宽度,并考虑到在大多数情况下物体的运动都不那么快。这样,电视信号在传输时可以有效地节省频谱资源。    

扫描后产生的电信号可以涮制到高频载波上,以进行随后的地面传播、电缆传输或卫星传送,当然也可以不经调制而直接以基带信号的形式去显示或记录。


2,取样

 取样(sampling)是用一个周期为T的窄脉冲序列对模拟信号的幅度进行抽取,把随时间连续变化的模拟信号变成时间抽上不连续的离散信号,这个过程实际上是在每一条水平扫描线上等间隔地抽取视频图像某些特定像素点的属性值,这一过程又称为采样或抽样。

毋庸置疑,从模拟信号到数字信号要经过模/数转换(A/D转换),因此,在视频技术中的A/D转换就是要将模拟视频信号转换为数字视频信号。在对模拟视频信号进行数字化时,捕获包含在模拟信号中的有用和期望的信息并去除冗余成分是非常关键的。所以,为了正确执行A/D转换过程,必须知道数字化信号的某些属性。    

视频信号的一般属性包括带宽、信噪比、信号失真度和动态范围。带宽说明了给定时间周期内的模拟信号的最大可能变化,因此它次定了为保留信号的信息内容而必须在每个单位时间的取样点数。动态范围和其他因素决定了保存信号振幅的精确程度。为将模拟信号转换为数字信号,通常对模拟信号进行等时间间隔取样,而且每个取样的幅值都数量化,并分配给一个数字码字。

取样频率的选取对于一个数字系统至关重要。如果取样频率取得太高,其数字化后的数据比特率就很高,会造成传输和存储困难;如果取得太低,又会丢失信号的重要信息,造成分辨率下降并产生某些干扰信号。    

根据奈奎斯特取样定理,为了能够由取样的样值信号正确恢复出原始信号,其取样频率至少要达到信号最高频率的2倍。如果取样频率小于2倍最高频率,则会出现混叠现象,从而对视频图像信号本身产生干扰。为了解决此问题,通常在取样前,要对有噪声的视频图像信号进行低通滤波。模拟信号被看作是一个连续的图像函数,取样便是对图像函数的空问坐标进行离散化处理。对这样一个



3.量化    

经过取样后的视频图像,只是空间上的离散像素阵列,而每个像素的亮度值仍是连续的,因而必须将它们转换为有限个离散值,这个过程称为量化(quantifying),如果像素值等间隔分层量化,则称之为均匀量化;若使用非等问隔进行分层量化,则称为非均匀量化。    

量化是对每个离散点——像素的灰度或颜色样本进行数字化处理,在样本幅值的动态范同内进行分层、取整,以正整数表示。采用有限个量化电半来代替无数个取样电平,使原来幅度连续变化的模拟信号变成了一系列离散的量化电平值。进一步展现信号幅值被数字化的示意。    

在A/D转换器的输出端,模拟信号取样的瞬时值是由有限而且定长的二进制代码值表示的,转换到离散幅值时,可能引入舍人误差和量化噪声。    

为了能尽可能不失真地重现模拟信号,量化电平的选择也是应该重视的。显然,将量化电平分得越细,其失真程度就会降低,但数字化后的比特牢也会成倍增加;如果选得太低,信号就会出现轮廓效应,并伴随有量化噪波。    

最佳量化的目标是使用最少的电平数实现最小量化误差。设计最佳量化器的方法有两种一种是客观的计算方法,它根据量化误差的均方值为最小的原则,计算出判决电平和量化器输出的电平值。另一种是主观准则设计方法,它根据人眼的视觉特性设计量化器。    

一般说来,对于二进制方式,其量化比特数取为8位,因而其量化电平数为2^8=256级,基本满足人眼的视觉特性。因此,目前在数字视频领域广泛采用8位量化。    

编码(coding)就是按照一定照规律,将量纪后的值用数字表示,然后变换成二进制或其他进制的数字信号,对一个模拟信号进行取样、量化后,编码就是对每一个量化电平分配一个二进制码。对于4个量化电平,通常用2位表示。如果这4个电平仅是256个量化电平中的一部分,那么就要用8位表示。    

通过取样、量化和二进制编码所形成的信号称为脉冲编码调制信号(Pulse Code Modulation,PCM)。    

 


视频编解码的要求是在尽可能低的码率下获得尽可能好的图像质量。


  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值