11_多媒体技术

多媒体基本概念

媒体的分类

媒体分为以下五大类。

感觉媒体:直接作用于人的感觉器官,使人产生直接感觉的媒体。常见的感觉媒体分为文本、图形、图像、动画、音频和视频。

表示媒体:指传输感觉媒体的中介媒体,即用于数据交换的编码。如文本编码、声音编码和图像编码等。

表现媒体:进行信息输入和信息输出的媒体,也即输入输出设备。如键盘、鼠标和麦克风、显示器、打印机和音响等。

存储媒体:存储表示媒体的物理介质。如磁盘、光盘和内存等。

传输媒体:传输表示媒体的物理介质。如电缆、光纤、双绞线等。

声音

主要用声音的带宽(图2-3-2)来衡量声音的大小,单位是Hz。声音是一种模拟信号,要对其进行处理,就必须将其转化为数字信号。转换过程有三个步骤:采样、量化、编码。

人耳能听到的音频信号的频率范围是20Hz~20kHz。

声音的采样频率一般为最高频率的两倍,才能保证不失真。

(1)数字音乐合成方法。

数字调频合成法(FM):使高频振荡波的频率按调制信号规律变化的一种调制方式。采用不同调制波频率和调制指数,就可以方便地合成具有不同频谱分布的波形,再现某些乐器的音色。可以采用这种方法得到具有独特效果的“电子模拟声”,创造出丰富多彩的声音,是真实乐器所不具备的音色。

波表合成法(Wavetable):将各种真实乐器所能发出的所有声音(包括各个音域、声调)录制下来,存储为一个波表文件。播放时,根据MIDI文件记录的乐曲信息向波表发出指令,从“表格”中逐一找出对应的声音信息,经过合成、加工后回放出来,合成的音质更好。

(2)声音特性。

音高:表示各种声音的高低,主要取决于声波的振动频率,振动频率越高则音越高。音调:表示声音的调子的高低,由声音本身的频率决定。

音色:又称为音品,由声音波形的谐波频谱和包络决定。

声音文件格式:.wav、.snd、.au、.aif、.voc、.mp3、.ra、.mid等。

图形和图像

(1)颜色三要素。

亮度:彩色明暗深浅程度。

色调(红、绿):颜色的类别。

饱和度:颜色的纯度,即颜色的深浅,或者说掺入白光的程度。

(2)彩色空间。即设备显示图片所使用的色彩空间,普通的计算机显示器是RGB色彩空间,除了红、绿、蓝三原色外,其他颜色都是通过这三原色叠加形成的。

电视中使用YUV色彩空间,主要是为了兼容黑白电视,使用的是亮度原理,即调不同的亮度,显示不同的颜色。

CMY(CMYK),印刷书籍时采用的色彩空间,这个采用的是和RGB相反的减法原理,浅蓝、粉红、黄三原色的印刷颜料实际上是吸收除了本身色彩之外的其他颜色的,因此,印刷出来才是这些颜色。

HSV(HSB),艺术家彩色空间,是从艺术的角度划分的。

图像的属性:分辨率(每英寸像素点数dpi)、像素深度(存储每个像素所使用的二进制位数)。

图像文件格式:.bmp、.gif、.jpg、.png、.tif、.wmf等。

DPI:每英寸像素点数。

图像深度是图像文件中记录一个像素点所需要的位数,用来确定图像每个像素可能有的颜色数。

显示深度表示显示器中存储屏幕上一个点的位数(bit),也即显示器可以显示的颜色数。

水平分辨率:显示器在横向上具有的像素点数目。

垂直分辨率:显示器在纵向上具有的像素点数目。

矢量图的基本组成单位是图元,位图的基本组成单位是像素,视频和动画的基本组成单元是帧。

真彩色:指图像中的每个像素值都分成R、G、B三个基色分量,每个基色分量直接决定其基色的强度,这样产生的色彩称为真彩色。

伪彩色:图像的每个像素值实际上是一个索引值或代码,该代码值作为色彩查找表中某一项的入口地址,根据该地址可查找出包含实际R、G、B的强度值。这种用查找映射的方法产生的色彩称为伪彩色。

多媒体相关计算

图像容量计算

(1)已知像素,位数。每个像素为16位,图像为640×480像素,则容量为640×480×16÷8=614400B。

(2)已知像素,色数。640×480像素,256色的图像,则容量为640×480×log₂(256)÷8=307200B。

音频容量计算

音频容量=采样频率(Hz)×量化/采样位数(位)×声道数/8

视频容量计算

视频容量=每帧图像容量×每秒帧数×时间+音频容量×时间

例:使用150DPI的扫描分辨率扫描一幅3×4英寸的彩色照片,得到原始的24位真彩色图像的数据量是( )Byte。

解析:DPI是每英寸像素点数,因此扫描后像素点数为3×150×4×150=270000个,24位彩色图像的含义是每个像素点占24bit=3Byte,因此数据量为270000×3=810000Byte。

常见多媒体标准

JPEG标准和MPEG标准

主要是图像的JPEG标准和视频的MPEG标准,对于MPEG,要掌握每个级别的代表设备标准,具体如图2-3-3所示。

数据压缩基础

数据能够压缩的前提是有冗余,冗余分类如下。

空间冗余(几何冗余):对于一副画面中同样的信息,在压缩时,不需要重复存储,只记录一次信息内容,而后记录这些相同信息出现的位置即可。

时间冗余:在压缩视频时,对于一帧和下一帧,只记录变化的部分,不变的部分不记录。

视觉冗余:例如JPEG标准,就是有损压缩,对于人眼关注不到的细节就不存储,找到一个临界值,达到视觉欺骗的效果。

信息熵冗余:不同的信息编码的冗余效率是不同的,可以通过改变信息编码来改变冗余。

结构冗余:对于结构相同的模块,只记录一次。和空间冗余有点类似。

知识冗余:从知识角度来说,有些可以根据常识推导出来的东西,可以不用记录。

有损压缩和无损压缩

压缩后能够还原的编码方式称为无损压缩(熵编码法):例如WINRAR压缩等,最终可以还原出原数据,最经典的无损压缩就是哈夫曼编码。

压缩后无法还原的编码方式就是有损压缩(熵压缩法):例如JPEG格式的图片。

  • 29
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值