一、多媒体的基本概念
什么是媒体?
信息的物理载体:存储信息和传递信息的载体,如书本、磁盘、光盘等
承载信息的载体:信息的表现和传播形式,如文字、声音、图像等(视觉、听觉、触觉)
(一)媒体的分类
感觉媒体:指直接作用于人体感官,人能够感觉得到的(声音听觉、触觉、视觉等)
表示媒体:指信息的表示形式(文字、图形、图像、音频和视频的编码等)
表现媒体:指信息输入输出的物理设备(键盘、显示器、打印机、话筒、扫描仪等)
存储媒体:指存储数据的物理介质(硬盘、U盘、光盘、ROM、RAM等)
传输媒体:指传输数据的物理介质(电缆、光纤、电磁波和交换设备等)
(二)多媒体的特征
1、多媒体技术
-
利用计算机技术把多种媒体综合起来,建立连接并集成为一个具有交互性的系统
2、主要特性
多样性:信息多样化,信息的表现形式多样
集成性:多种信息按照一定的结构集成为一个整体,如声音的图像信息组合成视频等
交互性:传统媒体只能单向被动传播信息,而多媒体能实现人对信息的自主选择使用等
非线性:传统媒体大都是采用章、节、页的死板框架,而多媒体能够以灵活的方式呈现
实时性:人们对多媒体信息的操作能够给予及时的反馈,能够实时控制
信息使用的方便性:用户能够按照自己的需求、爱好等来获取图、文、声等信息
信息结构的动态性:用户可以按照自己的目的和想法重新组织信息,即增删修改等
(三)多媒体计算机系统
1、硬件系统
-
多媒体计算机MPC = PC+CD-ROM+声卡+显卡+多媒体操作系统+其他外设
2、软件系统
-
多媒体操作系统:支持多媒体应用软件的运行;支持输入/输出及相应的软硬件接口
-
多媒体素材创作编辑软件:文本工具、图形图像工具、动画工具、音频工具。
3、多媒体应用软件
-
各种信息的演示、播放和操作等软件
二、音频
(一)数字声音基础
1、声音信号
(1)声音是通过空气传播的一种连续的波,称为声波。声波在时间的幅度上都是连续的模拟声音信号,通常称为音频信号。
(2)人们对声音的感觉主要有:
音量(也称响度):声音的强弱程度,取决于波形的幅度(振幅)大小
音调:频率表现为音调高低,取决于声波的基频,高就尖锐,低就低沉
音色:由混入基音(基波)的泛音(谐波)决定,每种声音都有其固定的频率和不同强度的泛音,泛音越丰富音色越好
(3)声音信号的两个基本参数是振幅和频率
振幅通常用动态范围表示,单位:分贝(dB)
频率是指声波每秒钟变化的次数,单位:Hz
亚音信号(次音信号):小于20Hz的声波信号
音频信号(人耳能听到的声音):20Hz~20kHz的声波信号
超音频信号(超声波):高于20kHz
人类说话声音:300Hz~3400Hz
乐器演奏声音:为20Hz~20kHz
2、声音信号的数字化:采样、量化、编码
(1)采样:模拟信号---数字信号
采样是把时间连续的模拟信号转换成时间离散、幅度连续的信号,以某一特定的时刻获取声音信号的幅值叫做采样,由这些特定时刻采样得到的信号称为离散时间信号(数字信号)
采样频率:每隔相等的一小段时间采样一次,
采样频率是取样周期的倒数
为了不产生失真,采样频率应不低于声音信号的最高频率的两倍
取样周期:间隔时间
语音信号(人类发出的声音)的采样频率一般为8kHz以上
采样的频率越高,可恢复的声音信号分量越丰富,声音保真度越好
采样精度:表示采样声音大小范围的划分,划分得越细,精度越高,声音质量越好,越清楚
(2)量化
量化是把在幅度上连续取值(模拟量)的每一个样本转换为离散值(数字量)表示,就是把采样所获取的模拟信号的值,用数值的形式表示,量化的过程也称为A/D转换(模数转换)
量化后的样本是用二进制来表示的,二进制位数的多少反映了度量声音波形幅度的精度,称为量化精度
例如:
每个声音样本用16位二进制(2字节)表示,则声音样本的取值范围是0~65535,精确度为1/65536
如果用8位二进制(1字节)表示,则样本的取值范围是0~255,精度是1/256
量化的精度越高,声音的质量越好,存储声音所需的存储空间越多
(3)编码
经过采样和量化处理后的声音信号已经是数值形式了,但是为了便于计算机存储、处理和传输,还需要按照一定的要求进行数据压缩和编码,以减少数据量,再按照某种规定的格式将数据组织成为文件
(4)数字化处理之后数字声音的主要参数
3、声音的表示
(1)表示方法:波形声音、合成声音
(2)波形声音
波形声音(自然声音)是通过对实际声音的波形信号进行数字化(取样和量化)而获得的,它能高保真地表示现实世界中任何客观存在地真实声音。波形声音的数据量比较大
声音信号数字化后,其数据传输率(每秒位数)与信号在计算机中的实时传输有直接关系,而其总数据量与计算机的存储空间有直接关系
未经压缩的数字音频数据传输率可按以下公式计算:
数据传输率(每秒位b/s) = 采样频率(Hz) X 量化位数(b) X 声道数
波形声音经过数字化后所需占用的存储空间可用如下公式计算:
声音信号数据量 = 数据传输率 X 持续时间/8(B)
![](https://i-blog.csdnimg.cn/blog_migrate/da52eb16a8a452e750fa3c8f297fdd9c.png)
(3)合成声音
合成声音使用符号(参数)对声音进行描述,然后通过合成的方法生成声音
符号化的声音表示方法所产生的声音没有自然声那么真实、逼真,但数据量要比波形声音小得多(2~3个数量级),而且能产生自然界中不存在的声音,其编辑处理比波形声音更加方便一些
合成声音是一类使用符号表示的,由计算机合成的声音,包括语音合成和音乐合成
语音合成目前主要是指从文本到语音的合成。先将文字序列转换成音韵序列,再由语音合成器生成语音波形
音乐合成。音乐可以使用电子学原理合成出来,模拟各种乐器的音色。电子乐器由演奏控制器和音源(音乐合成器)组成
数据传输率的计算:
传输率 = 采样频率(Hz)× 量化/采样位数(位)× 声道数
三、图像和图像
(一)图像的基础知识
1、色彩三要素
-
彩色是通过光被人类感知的,可以用亮度、色调和饱和度三个物理量来描述
(1)亮度:是用来描述光的明暗深浅程度
(2)色调:指颜色的类别,如红、绿、蓝等不同的颜色
(3)色饱和度:指某一颜色的深浅程度(浓度)。对于同一种色调的颜色,其饱和度越高颜色越深,饱和度越低颜色越浅
2、三基色原理
-
光的三原色:红、绿、蓝(rgb)
-
三基色选择并不唯一
3、色彩空间
-
彩色空间(彩色模型):指彩色图像所使用的颜色描述方法
(1)RGB彩色空间:以红绿蓝三种颜色为基色(电脑显示器)
(2)CMY彩色空间:以青(cyan)、品红(magenta)和黄的为基色(印刷)
(3)YUV彩色空间:由亮度信号Y、色差信号U、V组成(电视)
(二)图形和图像信息的表示和获取
-
在计算机中的图形数据的表示形式
(1)几何图形或矢量图形,简称图形
(2)点阵图像或位图图像
1、矢量图形
-
矢量图形是通过指令描述构成一幅图的所有直线、曲线、圆、圆弧、矩形等图元的位置、维数和形状
2、位图图像
-
位图图像是指用像素点来描述的图
-
图像一般是用摄像机或扫描仪等输入设备捕捉实际场景画面,把一幅彩色图或灰度图分成许许多多的像素点,每个像素点用若干个二进制位来指定此像素的颜色和亮度
![](https://i-blog.csdnimg.cn/blog_migrate/5525b305de101cc53e0cdfd2baa21ef9.png)
3、图形图像的转换
-
图形和图像都是以文件的形式存放在计算机存储器中,一般可以通过硬件(输入输出设备)或软件实现图形和图像之间的转换
-
同一个对象既可被作为图形处理,也可以作为图像处理
-
能相互转换并不表示可以任意互换,实际上许多转换是不可逆的,转换的次数越多,丢失的信息就越多,特别是图形和图像之间的转化
4、分辨率和图像深度
(1)分辨率:显示分辨率和图像分辨率
显示分辨率:是指显示器上能够显示出的像素数目
例如,显示分辨率为1024×768表示显示屏分成768行(垂直分辨率),每行(水平分辨率)显示1024个像素,整个显示屏就包含796432个显像点
屏幕能够显示的像素点越多,显示设备的分辨率就越高,显示的图像质量越高
图像分辨率:是指组成一幅图像的像素密度,也是用水平和垂直的像素表示,即用每英寸多少像素点(dpi)表示数字化图像的大小
例如,用200dpi来扫描一幅2×3英寸的彩色照片,可以得到一幅400×600个像素点的图像
图像分辨率确定的是组成一幅图像的像素数目,而显示分辨率确定的是显示图像的区域大小
它们之间的关系
图像分辨率大于显示分辨率时,在屏幕上只能显示部分图像
图像分辨率为小于屏幕分辨率时,图像只占屏幕的一部分
(2)图像深度
图像深度是指存储每个像素所用的位数,它也是用来度量图像的色彩分辨率的
像素深度确定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数,它决定了彩色图像中可出现的最多颜色数或灰度图像中最大灰度等级。
如一幅图像的图像深度为b位,则此图像最多颜色数或灰度级为2^b种
例如
只有一个分量的单色图像,若每个像素有8位,则最大灰度数目为2^8=256
一幅彩色图像的每个像素用R、G、B三个分量表示,如果三个分量的像素位数分别为4、4、2,则最大颜色数目为2^(4+4+2) = 2^10 = 1024,就是说像素深度为10位,每个像素可以是2^10种颜色中的一种。表示一个像素的位数越多,它能表达的颜色数目就越多,它的深度就越深
5、真彩色和伪彩色
(1)真彩色
例如:用RGB(8:8:8)方式表示一幅彩色图像,R、G、B分量都用8位来表示,可生成的颜色数就是2^24种,每个像素的颜色就是其中的数值(二进制表示)直接决定的
每个像素点都用二进制表示实际颜色,色彩深度:24位
因为都要用二进制表示,占用空间较多,但是速度快
(2)伪彩色
为了减少彩色图形的存储空间,在生成图像时,对图像中不同色彩进行采样,建立彩色查找表,给每个彩色进行编号。根据像素点颜色在查找表中找到对应的颜色,读出编号
色彩查找表可以是一个预先定义的表,也可以是对图像进行优化后产生的色彩表。常用的256色的彩色图像使用了8位索引,即每个像素占用一个字节
省空间,速度慢
(三)图形和图像的文件格式
扫描生成一幅图像时,实际上就是按一定的图像分辨率和一定的图像深度对模拟图片或照片进行采样,从而生成一幅数字化的图像
图像的图像分辨率越高,图像深度越深,则数字化后的图像效果越逼真,图像数据量越大
按照像素点及其深度映射的图像数据大小采样,可以用以下公式估算数据量
图像数据量 = 图像的总像素×图像深度/8(B)
(四)图像容量的计算
四、动画和视频
(一)动画的基本概念
-
动画的本质是运动
(二)动画分类
1、根据运动的控制方式
-
实时动画:采用各种算法来实现运动物体的运动控制
-
矢量动画:利用数学函数来记录和表示图形的线条颜色尺寸坐标等
2、根据视觉空间的不同
-
二维动画:对传统动画的一个改进,不仅具有模拟传统动画制作功能,而且可以发挥计算机所特有的功能(图像的拷贝、改变大小位置等)。
-
三维动画:画面中的景物有正面、侧面和背面,调整三维空间的视角,就能看到不同的内容
(三)视频的分类
1、模拟视频
2、数字视频
3、视频容量的计算
-
容量 = 每帧图像容量(Byte) × 每秒帧数 × 时间 + 音频容量 × 时间
4、常见的多媒体标准
- JPEG:是目前最为常见的图像文件标准,它是有损压缩,RGB转YUV,运用了离散余弦算法,放大后模糊
- JPEG-2000:是JPEG的升级版,目前在医学图像等专业领域应用比较广泛,既有有损的压缩算法又有无损的压缩算法,压缩比更高
- MPEG-1:其中定义了VCD和MP3的格式,运用了离散余弦算法
- MPEG-2:其中定义了DVD格式,运用了离散余弦算法,在有线/卫星电视领域应用较为广泛
- MPEG-4:增强了交互性,应用于网络应用、可视电话和无线通信
- MPEG-7:是多媒体内容描述接口,具备描述功能,不是编码标准
- MPEG-21:融合了不同的协议,制定了新标准,主要是标准的集成
五、数据压缩
(一)数据压缩的条件:冗余
- 有多余的地方
① 空间冗余(几何冗余)
② 时间冗余
③ 视觉冗余
④ 信息熵冗余
⑤ 结构冗余
⑥ 知识冗余
(二)分类:有损压缩与无损压缩
-
有损压缩:压缩之后,原始信息已损坏,无法还原,也称为熵压缩法,如JPEG格式使用的离散余弦编码
-
无损压缩:使用编码的方式压缩,无信息的损坏,可以还原,也称为冗余压缩法或熵编码法,如Win RAR压缩和Huffman编码