1 媒体的定义
存储信息的实体:如磁盘、光盘、磁带、U盘等
传递信息的载体:如数字、文字、声音、图形和图像等。
1.1 多媒体的定义
在计算机中,文字、声音、图形、图像、动画、视频等信息载体结合在一起,形成一个有机的整体,称之为“多媒体”
2 模拟信号&数字信号
2.1 模拟信号
随时间连续变化的电信号,通过电流和电压的变化进行传输。如自然话音信号。
2.2 数字信号
离散变化的电信号,由二进制代码“0”和“1”组成的信号。
2.3 为什么需要将模拟信号数字化?
自然界中存在的图像、声音和视频都是连续的模拟信号,而计算机只能处理离散的数字信号。
因此,需要首先对这些模拟信息进行数字化处理,将其转变为计算机能够识别的数字信号,以便进一步分析处理。
2.4 模拟信号数字化的过程
3 数据压缩
数据压缩是对数据重新进行编码,以减少所需的存储空间。
其逆过程称为解压缩,将压缩过的数据恢复还原。
3.1 为什么要进行数据压缩?
由于数字化声音、图像、视频的数据量非常庞大,使得计算机系统的时间和空间开销巨大,因此数据压缩是必须的。
e.g. 存储1秒钟的CD双声道立体声音乐,需要的存储空间与存储9万个汉字所需的空间相同。
3.2 数据压缩的条件
多媒体数据信息存在冗余:
原始多媒体数据客观上存在大量冗余。( e.g. 图片中大面积的蓝天)
人的感观具有不敏感性,多媒体数据主观上存在一些冗余。( e.g. 人们听觉上对高低音不敏感)
3.3 数据压缩的方法
3.3.1 无损压缩
压缩后的数据经解压缩后可100%还原,不存在任何误差。
压缩比低,为 2:1 或 4:1。
例如:磁盘文件压缩 WinZip/WinRAR。
3.3.2 有损压缩:
压缩后的数据经解压缩后与原始数据存在一定误差。
压缩比高,可高达100:1
例如:图像、视频、音频数据的压缩。
4 RGB彩色空间
R,G,B分别代表红(red)、绿(green)、蓝(blue)三色。
通过对R、G、B三个颜色通道的变化以及它们相互之间的叠加可得到各式各样的颜色。
4.1 图像文件常见格式
4.1.1 JPG
较高的压缩比,色彩数可达到 24 位,多用于相片
4.1.2 GIF
无损压缩,最多256色,多用于小图标
4.1.3 TIFF
未压缩或简单压缩,文件体积庞大,多用于扫描、传真等。
4.1.4 BMP
Windows中的位图,一般未压缩,文件比较大
5 矢量图形
矢量图形是通过数学计算的方法生成的。
图形文件中存储的是描述点、线、面等大小形状及其位置、维数的指令,计算机读取这些指令将其转换为屏幕上所显示的形状和颜色。
例如,汽车轮胎由圆形组成。
矢量图形主要用于线形的图画、简单图案等。占用空间小。显示与分辨率无关,放大或缩小不影响图形显示。
常用处理软件如 Adobe Illustrator.
6 位图
位图图像是由像素点阵组成的画面,每个像素点的颜色和亮度存储在一系列二进制位中。
位图图像适合于表现色彩丰富、包含大量细节的图像,如自然影像等。占用空间较大。
显示与分辨率有关,放大时,部分像素点被丢失,图像呈锯齿状。
常用处理软件如Photoshop、Fireworks 等。
7 声音处理:声卡
声卡是进行音频信息处理的重要部件。
1)将模拟信号数字化
2)压缩和解压缩音频信号
3)语音合成和语音识别
7.1 音频文件常见格式
7.1.1 WAV
直接记录声音波形,具有很高的音质,但存储容量非常大,不利于音乐的网络传播。
7.1.2 MP3
MPEG-1 audio layer3.
是一种高性能的声音压缩编码方案,在保证音质近乎完美的情况下,文件的尺寸却非常小,压缩比高达 1:12,使网上的音乐传播成为现实。
7.1.3 MID
数字音乐/电子合成乐器的统一国际标准。
MID 文件包含的是音乐演奏指令序列,声卡按照指令将声音合成出来。可以模拟大提琴、小提琴、钢琴等常见乐器。
MID文件由于数据量非常小,在多媒体光盘和游戏制作中应用比较广泛。
7.1.4 CDA
光盘数字音频文件,即CD音乐,近似无损的高质量声音。
7.2 视频文件常见格式
7.2.0 影像和动画的编码
影像主要是由时间上连续序列的数字化图像再加上数字化声音的合成体。
影像是在时间和空间上对活动场景的离散采样。
影像中的一张图像是对某一时刻场景的空间离散采样,称为影像的一帧。
每秒约25帧的连续帧采样就形成影像。
为什么每秒需要约25帧的连续帧?这是和人眼的视觉效果有关。通常一秒钟需要采样24帧左右,才能在视觉上感知为连续影像。当每秒钟采集的影像帧再减少,视觉上会有断续感,效果变差。如果多于30帧/秒,视觉基本上没有区别了,因为人眼的分辩能力有限。
影像所需要的存储空间非常大。存储10分钟的640×480的真彩色(24位)连续影像,按照每秒钟25帧计算,不包括声音信息,需要(640×480×3 byte×25帧×10分钟×60秒)个字节,大约13GB( 13184M) 字节。
与影像相比,动画中的每一帧都是用矢量图形来存储的,因此数据量比之影像要小很多。
7.2.1 AVI(Audio Video Interactive)
音频视频交错格式,是Windows中较通用的视频格式.
采用有损压缩技术,压缩比高,但面质量不理想。
7.2.2 MPEG
运动图像压缩的国际标准,平均压缩比为 50:1, 最高可达 200:1。
广泛应用与 VCD、DVD。
7.2.3 MOV
Apple公司QuickTime视频处理软件,质量比AVI好。
7.2.4 FLV(flash video)
是随着Flash MX推出发展来的一种流媒体视频格式,体积小巧,质量良好,在网络上盛行。
8 流媒体
指采用流式传输的方式在Internet播放的媒体格式。
8.1 流式传输方式
流式传输方式是将视频和音频等多媒体文件经过特殊的压缩方式分成一个个压缩包,由服务器向用户计算机连续、实时传送。
用户只需要经过几秒钟或几十秒的延时即可在用户计算机上利用相应的播放软件进行播放,剩余的部分将继续进行下载,直至播放完毕。