多媒体基础知识
媒体是指承载信息的载体,可以分为感觉媒体,表示媒体、显示媒体、存储媒体和传输媒体五种。多媒体是指多种信息载体的表现形式和传递方式,即将音频、视频、图像和计算机技术、通信技术集成到同一数字环境中,以协同表示更丰富和复杂的信息。
1.1 音频
1.1.1 音频基础知识
1. 声音信号
声音是通过空气传播的一种连续的波,称为声波。声波在时间和幅度上都是连续的模拟信号,称为模拟声音信号。人们对声音的感觉主要有音量、音调和音色。
(1)音量(响度):声音的强弱程度,取决于声音波形的幅度,取决于振幅的大小和强弱。
(2)音调:人对声音频率的感觉表现为音调的高低,取决于声波的基频。基频越低,给人的感觉越低沉,越高越尖锐。
(3)声色:由混入基音(基波)的泛音(协波)所决定,每种声音都有其固定的频率和不通音强的泛音,从而使他们具有特殊的音色效果。
(4)带宽:组成声音的信号的频率范围。人耳能听到的声音的频率的范围是20HZ---20KHZ。
声音信号的两个基本参数是幅度和频率。幅度是指声波的振幅,用分贝为单位计算。频率指声波每秒种变化的次数,用HZ表示,人们把频率小于20HZ声波信号成亚音信号(次音信号),频率为20HZ---20KHZ的声波信号成为音频信号,高于20KHZ的信号成为超音频信号(也称超声波)。
2. 声音信号的数字化
声音信号是一种模拟信号,计算机要对她进行处理,要转化为数字声音信号。最基本的声音信号数字化方法是取样-量化法。
(1) 采样:采样把时间连续的模拟信号转化成时间离散、幅度连续的信号。在某些特定的时刻获取声音信号的幅值叫采样。语音信号的采样频率一般为8KHZ,音乐信号的采样频率一般为40khz以上。
(2) 量化:把在幅度上连续取值的每一个样本转换为离散值。最后的样本是二进制数来表示。若每个声音样本用16b(2B)表示,则声音样本的取值范围是216,0-65535,精度是1/65536;若用8b(1B)表示,则样本的取值范围是0-255,精度是1/256。量化精度越高,声音的质量越好,需要的存储空间也越多。
(3) 编码:经过采样和量化处理后的声音信号已经是数字形式了,还须按照一定的要求进行数据压缩和编码,以减少数据量,在按照某种规定的格式将数据组织成为文件。
3. 音频文件大小的计算
波形声音信息是一个用来表示声音振幅的数据序列,它可以通过对模拟声音按一定间隔采样获得的幅度值,再经过量化和编码后得到便于计算机存储和处理的数据格式。
未经压缩的数字音频数据传输率按下式计算:
数据传输速率(b/s)=采样频率(HZ)×量化位数(b)×声道数
波形声音经过数字化后所需占用的存储空间按下式计算:
声音信号数据文件大小=数据传输率×持续时间/8(B)
例:若语音信号信号的带宽为300-3400HZ,量化精度为8位,单声道输出,计算每秒钟及每小时的数据量。
解:采样频率为8KHZ,
每秒数据量:8KHZ×8b×1/8=8KB/S=64Kb/s.
1小时数字语音的数据量大约为28MB。
例:若光盘上存储的立体声高保真数字音乐的带宽为20-2000HZ,采样频率为44.1KHZ,量化精度为16位,双声道,计算1小时的数据量。
44.1KHZ*16b*2*1小时/8=653MB,
1.1.2 声音的合成
个人计算机和多媒体系统中的声音,除了数字波形声音外,还有一类是使用符号表示的,由计算机合成的声音,包括语音合成和音乐合成。
1. 语音合成
语音合成目前主要指从文本到语音的合成,也称为文语转换。主要有的技术有以下三种:
(1)发音参数合成:这种方法是对人的发音过程进行直接模拟,效果不理想
(2)声道模型参数合成:基于声道截面积函数或声道谐振特性合成语音。比特率低,音质适中。
(3)波形编辑合成:是直接把语音波形数据库中的波形拼接在一起,输出连续语流。合成的语音清晰自然。
2.音乐合成
音乐可以通过电子学原理合成出来(生成相应的波形),各种乐器的乐色也可以模拟。电子乐器由演奏控制器和音源两部分构成。
(1) 演奏控制器:一种输入和记录实时乐曲演奏信息的设备。
(2) 音源(也称为音乐合成器),音源是具体产生声音波形的部分,即电子乐器发生的部分,它通过电子线路把演奏控制器送来的声音合成器来。
1.1. 3 MIDI
MIDI(musical instrument digital interface)是乐器数字接口的缩写,泛指数字音乐的国际标准,是电子乐器和MIDI装置之间的通信标准。MIDI数据不是单个采样点的编码,而是乐谱的数字描述,称为MIDI消息,乐谱由音符序列、定时、音色音量等组成,每个消息对应一个音乐事件,一组MIDI消息(如键压下、键释放等),一组MIDI消息送到MIDI音源时,音源即合成出相应的音乐。所以MIDI文件存储的不是波形而是指令序列,它最大的特点是占用空间小,而且编辑灵活,可以自由地修改曲调、音色等属性,但不能够记录人声。
1.1. 4声音文件格式
数字声音在计算机中存储和处理时,其数据必须以文件的形式进行组织,所选用的文件格式必须得到操作系统和应用软件的支持。以下为声音文件的几种格式。
(1)Wave文件(.WAV):来源于对声音模拟波形的采样,经过量化后生成WAV文件,即波形文件,质量非常高,但文件数据量大。
(2)Mod 文件(.MOD):该格式的文件里存放乐谱和乐曲使用的各种音色样本,回放效果好,音色种类多,但其低音效果差,已淘汰。
(3)MPEG音频文件(.MP3):压缩率大,在网络和可视电话通信方面应用广泛,但音质不能令人满意,也是波形音频文件。
(4)RealAudio文件(.RA):有强大的压缩比和容错性,它为了解决网络传输带宽资源而涉及的 ,因此主要目标是压缩比和容错性,其次才是音质。
(5)MIDI文件(.MID/.RMI):它是目前较为成熟的音乐格式,成为音乐工业的数据通信标准,文件长度小,演奏灵活。
(6)CD Audio文件:记录是波形流,纯正的音乐,音质很好,它的缺点是无法编辑,文件太大。
1.2. 图形和图像
1.2.1 色彩与图像基础
1. 色彩的基本概念
彩色光作用于人眼,使之产生彩色视觉,为了确切的表示某一彩色光的度量,可以用亮度、色调、色饱和度3个量来表示。
(1)亮度:描述光作用于人眼时引起的明暗程度感觉,是指色彩明暗深浅程度。
(2)色调:指颜色的类别,如红色、绿色等不同颜色就是指色调。
(3)色饱和度:指某一颜色的深浅程度(或浓度),对同一色调的颜色,其饱和度越高,则颜色越深。
2. 三基色原理
从理论上讲,任何一种颜色都可以用3种基本颜色按不同比例混合得到。自然界中常见的各种颜色光,都可用红、绿、蓝3中颜色按不同比例相配而成。
红色+绿色 = 黄色
红色+蓝色 = 品红
绿色+蓝色 = 青色
红色+绿色+蓝色=白色
红色+青色=绿色+品红=蓝色+黄色=白色
凡是两种色光混合而成白光,则这两种色光互为补色。
3. 彩色空间
彩色空间指色彩图像所使用的颜色描述方法,也称为彩色模型。
(1)RGB彩色空间:彩色图像用R(red)、G(green)、B(blue)分量表示,通过这三种颜色相加获得。应用在计算机彩色显示器。
(2)CMY彩色空间:使用青(cyan)、品红(Magenta)、黄色(yellow)为三基色相减混合。在彩色印刷、彩色胶片和绘画等打印方面应用。
(3)YUV彩色空间:Y代表亮度信号,U、V为色差信号,它的优点在于解决了彩电与黑白电视的兼容问题,并减少象素所需的位数。数字化位通常采用Y:U:V=8:4:4或者8:2:2
(4)YIQ彩色空间:Y代表亮度信号,I 、Q为色差信号,NTSC制式的彩电。
(5)HSI彩色空间:用色调、饱和度和亮度来描述颜色的特性。
1.2.2计算机中的图形数据的表示
在计算机中的图形数据有两种常用的表示形式,一种称为几何图形或矢量图形,简称图形;另一种称为点阵图像或位图图像。
1. 矢量图形
矢量图形是用一系列计算机指令来描述和记录的一幅图的内容,即通过指令描述构成一幅图的所有直线、曲线、圆、圆弧、矩形等图元的位置、维数和形状。矢量图形可以方便的进行移动、缩放、变形、扭曲等变换,主要用于表示线框形的图画、工程制图等,多数CAD和3D造型软件使用矢量图形作为基本的图形存储格式。
2. 位图图像
位图图像指用象素点来描述的图,每个象素用若干位二进制来指定该象素的颜色、亮度和属性。位图适合于表现比较细腻、层次较多、色彩较丰富的图像。但占用存储空间大,需要进行数据压缩。
1.2.3图像的属性
1. 分辨率
分辨率有两种,即显示分辨率和图像分辨率
(1)显示分辨率是指显示屏上能显示出的象素数目。例如,显示分辨率为1024×768表示显示屏分成768行(垂直分辨率),每行(水平分辨率)显示1024个象素。
(2)图像分辨率是指组成一幅图像的象素密度,也用水平和垂直的象素来表示,即每英寸多少点(dpi)表示数字化图像的大小。如用200dpi来扫描一幅2×2.5英寸的彩色照片,那么得到一幅400×500个象素点的图像。
当图像分辨率大于显示分辨率时,屏幕只显示部分图像,当图像分辨率小于显示分辨率时,图像只占屏幕的一部分。
2. 图像深度
图像深度指存储每个象素所用的位数,也用于量度图像的色彩分辨率。图像深度用来确定彩色图像的每个像素可能有的颜色数,或者确定灰度图象的每个像素可能有的灰度级数。一幅图像的图像深度为b位,则该图像的最多颜色数或灰阶度为2b,表示一个象素颜色的位数越多,它能表达的颜色数或灰度级越多。例如,只有1个分量的单色图像,若每个象素有8位,则最大灰度数目为28=256;一幅彩色图像的每个象素用R、G、B三个分量来表示,若三个分量的象素位数分别为4、4、2,则最大颜色数目为24+4+2=210=1024,就是说象素的颜色深度
1.2.4图像文件大小的计算
条 件 | 实 例 | 说 明 |
知道象数,位数 | 一幅640×480的256色图像,每个象素为16位,其文件大小约为: 640×480×16/8=614 400B | 16位,可以表示216种颜色,即65536种颜色,也就是每个点需要2个Byte,共有640×480个点 |
知道象数,色数 | 一幅640×480的256色图像,其文件大小约为: 640×480×8/8=307 200B | 256=28,因此每个点要8位存储,即1字节 |
试题8
在计算机图象处理时,图象的空间分辨率是指__A__,在 PC 机中,__B__是常用的图象格式文件的后缀名。
若视频信号的每幅黑白图象均为 256 级灰度,1024×768 的点阵表示,当数据的压缩比为30 时,每幅图象所占的存储空间为__C__比特。以每秒 25 幅的方式播出时,容量为 600M 比特的视频图象以压缩形式在网上需传输__D__秒,传输速率不应低于每秒__E__比特。
供选择的答案:
A:(1)灰度 (2)点阵大小 (3)反差 (4)亮度
B:(1)BMP (2)PIC (3)WAV (4)EXE
C:(1)0.2M (2)2M (3)0.6M (4)6M
D:(1)32 (2)60 (3)87 (4)120
E:(1)5M (2)7.5M (3)10M (4)25M
● 某数码相机的分辨率设定为1600*1200像素,颜色深度为256色,若不采用压缩存储技术,则32M字节的存储卡最多可以存储__(55)__张照片。
(55) A.8 B.17 C.34 D.69
1.2.5图像、图形文件格式
(1) BMP文件
是Windows系统采用的图像文件格式,在Windows环境下运行的所有图像处理软件几乎都支持BMP文件格式。一般不采用任何压缩,占用的存储空间大,图像深度可选1位、4位、8位、及24位。
(2) GIF文件
是以数据块为单位来存储图像的相关信息,它可以在一个文件中存放多幅彩色图像,每一幅图像都有一个图像描述符、可选的局部彩色表和图像数据组成。把存储于一个文件中的多幅图像逐幅读出来显示,就构成了简单的动画效果。GIF图像深度从1位到8位,即最多支持256种色彩的图像,目前因特网上采用的彩色动画文件多为这种格式。
GIF文件格式定义了来年两种各种数据存储方式:一种是按连续存储,存储顺序与显示器的显示顺序相同,另一种是按交叉方式存储。由于显示图像要较长的时间,使用这种方法存放图像数据,用户可以在图像数据全部收到之前看到这幅图像的全貌,而不觉等待的时间太长。目前,GIF文件格式在HTML中得到广泛的应用。
(3) TIFF文件
TIFF(.TIF)文件是为扫描仪和桌面出版系统开发的一种较为通用的图像文件格式,是电子出版中的重要的图像文件格式,文件体积大,信息量也大,有利于原稿色彩的复制。最高可达16M色,即可用24位深度表示。
(4) PCX文件
经过压缩且节约磁盘空间的PC位图格式,可表现24位,随着JPEG的出现,已经很少使用了。
(5) PNG文件
是作为GIF的替代品出现的,存储彩色图像时,深度可达48位,在压缩时采用无损压缩算法。
(6) JPEG文件
JPEG(.jpg)文件,采用一种有损压缩算法,压缩比例很高,适合处理大量图像的场合,是一种有损的静态图像文件存储格式。
(7) Targe文件
Targe(.TGA)用于存储彩色图像,可支持任意大小的图像,最高彩色数可达32位,专业图形用户经常使用TGA点阵格式保存具有真实感的三位有源图像。
(8) WMF文件
只在Windows中使用,它保存的不是点阵信息,而是函数调用信息,它将图像保存位一系列GDI(图像设备接口)的函数调用,在恢复时,应用程序执行源文件(即执行一个函数调用)在输出社别上画出图像,具有设备无关性,常用于Office中。
(9) EPS文件
是用语言描述的ASCII图形文件
(10) DIF文件
是AutoCAD中的图形,它是以ASCII方式存储图像,表现在尺寸大小方面十分精确,可以被CorelDraw等软件调用编辑。
(11) CDR文件
CorelDraw的文件格式,是所有CorelDraw应用程序均能使用的图形文件。
1.3. 动画和视频
1.3.1 动画视频基础知识
1. 动画
动画是将静态的图像、图形及图画按一定的时间顺序显示而形成连续的动态画面。本质是运动。根据运动的控制方式可将动画分为实时动画和逐帧动画两种。实时动画是用算法来实现物体的运动;逐帧动画是通过一帧一帧显示动画的图像序列而实现运动的效果。
2. 模拟视频
(1)模拟视频原理
电视系统传播的信号是模拟信号。电视信号记录的是连续的图像或视象以及伴音(声音)信号。电视信号通过光栅扫描的方法显示在屏幕上,扫描从屏幕的顶部开始,一行一行地向下扫描,直至最底部,然后返回到顶部,重新开始扫描。这个过程产生一个有序的图像信号的集合,组成了电视图像中的一幅图像,称为一帧,连续不断的图像序列就形成了动态视频图像。每秒钟所扫描的数帧就是帧频,一般在每秒25帧时,人眼就不会感觉到闪烁。彩色电视系统采用相加混色,使用RGB作为3基色进行配色,产生R、G、B3个输出信号。RGB信号可以分别传输,也可以组合起来传输。根据亮色度原理,任何彩色信号都可以分解为亮度和色度。
(2)彩色电视的制式
电视信号的标准也称为电视的制式。世界上现行的彩色电视制式主要有三种:一是NTSC制式,1953年美国创立,日本、加拿大相继采用。二是PLA制式,1967年西德创立,中国、英国等采用;三是SECAM制式,1967年由法国创立,苏联和东欧等国采用。
制式 | 每秒帧数 | 每帧扫描行数 | 帧像素 | 刷新率 |
PLA | 25 | 625 | 768*576 | 50HZ |
NTSC | 30 | 525 | 720*486 | 60HZ |
SECAM | 30 | 625 | 768*576 | 50HZ |
1.3.2 视频文件大小的计算
视频文件其实就是连续的图像,因此在计算时只需要计算每帧所需的存储容量,然后乘以每秒的帧数,再乘以时间。
文件的字节数=每帧图像容量(B)*每秒帧数*时间,
每帧的容量计算与图像文件的计算方法一样。
1.3.3 视频文件的格式
1.FIic文件
(.FLI/.FLC),2D/3D动画制作软件中采用的动画文件格式,Flic具有较高的压缩率。
2.AVI文件
微软开发的一种数字音频与视频文件格式,允许音频和视频交错在一起同步播放,未限定压缩标准,不具有兼容性,用不同的压缩算法生成的AVI文件,必须用相同的解压算法才能播放出来,可在160*120像素的视窗内实现15帧/秒播放,并可带8位声。
3. Quick Time文件
(.MOV/.QT)是Apple公司开发的一种音频视频文件格式,用于保存音频视频信息。采用向量化的压缩技术,最高以160*120像素的视窗内实现15帧/秒来播放,用户还可以通过鼠标或键盘的交互式控制,可以观察某一地点周围360度的景象,或者从空间任何角度观察某一物体,具有广泛的应用。
4.MPEG文件
MPEG(.MPEG/.MPG/.DAT)文件格式是运动图像压缩算法的国际标准,它包括MPEG 视频、MPEG音频、 MPEG系统(视频、音频同步)3个部分。MPEG的平均压缩比为50:1,最高可达200:1,压缩效率高,同时图像和音响质量也非常好,并且在PC机上有统一的标准格式,兼容性好。
5.RealVideo文件
RealVideo (.RM)文件是Real Networks公司开发的一种流式视频文件格式,主要用来在低速率的广域网上实现实时传输活动视频影像,可以根据网络数据传输速率的不同而采用不同的压缩比率,从而实现影像数据的实时播放。
1.4 数据压缩技术
从以上视频音频图画等文件大小的计算可以看出,多媒体数据通常都非常庞大,如果不对他们进行压缩,是难以在计算机上存储和传输的。
(1) 数据压缩的基础
音频、图像和视频数据存在空间冗余、时间冗余、信息熵冗余、视觉冗余和听觉冗余,这就是数据压缩的基础。
l 空间冗余:在一幅图像的背景及景物中,在某一点自身与其相邻的一些区域中,常存在着有规则的相关性。这种相关性的图像部分,在数据中就表现为冗余,空间冗余是视频图像中常见的冗余。
l 时间冗余:对于电视动画类,在其序列的各前后相邻的两幅图像中,其图像呈现较强的相关性(画面相似),这就反映为时间冗余。
l 知觉冗余:包括视觉冗余、听觉冗余,是指在人们视觉和听觉分辨力以下的视、音频信号。若在编码时舍去这些在感知门限以下的信号,虽然这会使恢复原信号产生一定的失真,但不为人们所知。
l 信息熵冗余:信息理论认为如果信源编码的熵大于信源实际的熵,则信源中就一定存在冗余度。
例题:对动态图像进行压缩处理的基本条件是:动态图像中帧与帧之间具有 __(42)__ 。
(42) A、相关性 B、无关性
l C、相似性 D、相同性
(2) 数据压缩技术的分类
数据压缩技术可以分为两类,一类是无损压缩编码法,也称冗余压缩法、熵编码法;一类是有损压缩编码法,也称熵压缩法。
l 无损压缩法去掉或减少了数据发冗余,这些冗余值可以重新插入到数据中,因此是可逆的,也是无失真压缩。他通常使用的是统计编码技术,包括哈夫曼编码、算术编码、行程编码等,通常压缩比较低,通常是2:1—5:1之间。
l 有损压缩法压缩了熵,会减少信息量,因此是不可逆的。通常可以分为特征抽取和量化两大类。特征抽取包括基于模式的编码、分形编码等;量化包括零记忆量化、预测编码、直接映射、变换编码等方法。其中预测编码和变换编码是最常见的方法。有损压缩能够达到较高的压缩比,声音达到4:1--8:1,对于动态的视频数据高达100:1—400:1。
数据压缩方法 |
无损压缩编码 |
行程编码 LZW编码 哈夫曼编码 增量调制编码 |
有损压缩编码 |
预测编码 变换编码 分析-合成编码 混合编码 |
DPCM编码 ADPCM编码 最佳变换(K-L)编码 离散余弦(DCT)变换编码 量化编码 小波变换编码 分形图像编码 子带编码 矢量和激励线性预测 JPEG MPEG |
无损压缩:
1.行程长度编码
某些图像往往有许多颜色相同的图块。在这些图块中,许多连续的扫描行后有同一种颜色,或者同一扫描行上许多连续的像素都具有相同的颜色值。这种情况下,不需要存储每一个像素的颜色值,具有同一颜色的连续像素的数目成为行程长度,其压缩率的大小取决于图像本身。如果图像中具有相同颜色的横向色块越大,这样的图像块数越多,压缩比就越大,反之就越小。
2.哈夫曼编码
大多数图像常常包含单色的大面积图块,而且某些颜色比其他颜色出现的更频繁。霍夫曼编码的基本方式是先对图像数据扫描一遍,计算出各种像素出现的概率,按概率的大小制定不同长度的唯一码字,由此得到一张该图像的霍夫曼码表,编码后的图像数据记录的是每个像素的码子,而码字与实际像素值的对应关系记录在码表中,码表附在图像文件中。
有损压缩:
(1) 帧内压缩
帧内压缩也称空间压缩。同一景物表面上各采样点的颜色之间往往存在着连贯性,当压缩一帧视频时,仅考虑本帧的数据不考虑相邻帧间的冗余信息,这实际上和静态图像的压缩类似,梭鱼压缩后的视频数据仍可以以帧为单位进行编码。帧内压缩达不到很好的效果。
帧间压缩
视频具有运动性,视频或动画前后两帧具有很大的相关性,或着前后两帧信息变化很小,根据这一特性,压缩相邻帧间的冗余就可以达到很好压缩质量。帧间压缩也称为时间压缩,它通过比较时间轴上不同帧之间的数据进行压缩。帧差值算法是一种典型的时间压缩算法,它比较本帧与相邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样来减少数据量。仅适用不包含有剧烈运动景象的视频,若有剧烈运动景象的,采用帧间预测和运动补偿算法来保证视频质量。
● MPEG视频中的时间冗余信息可以采用__(41)__的方法进行压缩编码
(41) A.帧间预测和变换编码
B.霍夫曼编码和运动补偿
C.变换编码和行程编码
D.帧间预测和运动补偿
(3)数据压缩标准
计算机中使用的图像压缩编码方法有多种国际标准和工业标准。目前使用相当广泛的编码及压缩标准有H.261、H.263、JPEG、MPEG、DVI
l H.261:主要针对在ISDN上实现电信会议应用,特别是面对面的可视电话和视频会议而设计的。它在图像质量和运动幅度间进行了折中,即剧烈运动的图像要比相对静止的图像的质量差。它属于恒定码流可变质量编码。
l H.263:主要针对低带宽通信而设计的,在低带宽下能够提供比H.261更好的图像效果。现在已基本代替的H.261。
l JPEG:是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。JPEG专家组开发了两种基本的压缩算法,一种是采用基于DCT(离散余玄变换)为基础的有损压缩算法,另一种是以预测技术为基础的无损压缩算法。在V-CD和DVD-Video电视图像压缩技术中,就使用了JPEG的有损压缩算法来取消同方向上的冗余数据。为了在保证图像质量的前提下进一步提高压缩比,JPEG专家组制定了JPEG2000标准,这个标准中采用了小波变换(wavelet)算法。
l MPEG:(Moving Pictures Experts Group)动态图像压缩标准,是ISO制定和发布的视频、音频和数据的压缩标准。其基本方法是:单位时间内采集并保存第一帧信息,然后只存储其余帧对第一帧发生变化的部分,从而达到压缩的目的。它的三大特点是:兼容性好:压缩比高,可达200:1;数据的损失小。
MPEG
标准 | 关键特性 | 应用 |
MPEG-1 | 传输速率1.5Mbps,每秒30帧,具有CD音质,编码速率最高4M-5Mbps,在PAL制式下亮度信号分辨率为352×288,色差信号分辨率为176*144,帧速率为25帧/秒。在NTSC 制式下亮度信号分辨率为352*240,色差信号分辨率为176*120 | 用于数据电话网络上的视频传输,也可用作记录媒体或是在Internet上传输音频。 |
MPEG-2 | 传输速率3M-10Mbps,能够向下兼容,提供广播级视象和CD级音质,分辨率可达720*480 | 已适用于HDTV,实现了本是MPEG-3要实现的目标 |
MPEG-3 | 未面市就被抛弃,画面有轻度扭曲 | 仅用于音频 |
MPEG-4 | 传输速率4800-64000bps,分辨率为176*144。利用帧重建技术、压缩和传输数据,以求用最少的数据达到最佳的图像质量。而且与前面的标准相比,最大的不同在于提供了更强的 交互能力 | 应用于视频电话,视频电子邮件,电子新闻 |
另外,在MPEG标准中,还有两个比较重要的平配套协议:一是称为“多媒体内容描述接口“的MPEG-7,它为各类多媒体信息提供了一种标准化的描述。其目标是支持数据管理的灵活性、数据资源的全球化和互操作性。它可以支持音频视频数据库在存储和检索、广播媒体的选择、因特网个性服务等。二是MPEG-21,它的目标是将不同的协议、标准、技术有机的融合在一起。
l DVI:与MPEG-1相当,可达VHS水平,压缩后数据传输率为1.5Mbps。为了扩大DVI的应用,Intel公司还推出了DVI算法的软件解码算法,可以将未压缩的数字视频文件压缩为原来的1/5-1/10。