多媒体信息
计算机除了能存储、处理文字(数值和字符)外,还需要处理大量的图形、图像、音频、视频等多媒体的信息。这些多媒体信息虽然表现形式不相同,但在计算机中同样都是以0和1二进制表示的,这就需要对各种媒体信息进行不同的编码。将声音、图形、图像、视频转化为二进制代码的过程叫做数字化。
一、声音编码
1、声音的数字化过程
计算机需要处理声音信号就需要将这种模拟信号转换成数字信号,这个过程称为模拟信号数字化。数字化过程涉及声音的采样、量化和编码。采样和量的过程可由A/D(模/数)转换器实现,如果要将声音输出则通过D/A(数/模)转换器实现。
(一)采样
采样是每隔一定时间间隔在声音波形上取一个幅度值,把时间上的连续信号变成离散信号。
该时间间隔称为采样周期,其倒数为采样频率(即每秒钟采样的次数)。如:44.1kHz 表示1s的声音用44100个采样点数据表示,由此采样频率越高,数字化音频的质量越好。
市面上非专业声卡采样最高频率为48kHz,专业能达到96kHz甚至更高。根据采样定律,采样频率高于声音中最高频率两倍就能恢复原始波形。所以在实际采样中,采取44.1kHz作为高质量声音采样标准。
(二)量化
量化是将每一个采样点得到的幅度值以数字存储。量化位数(也即采样精度),表示存放采样点振幅的二进制位数,它决定模拟信号数字化以后的动态范围。
如:8位、16位、32位,分别表示28、216、232个等级,16位是普遍采用的标准。由此可以看出量化位数越大,则采样精度越高,声音的质量越好,当然所占存储空间也越大。
(三)编码
编码是将采样和量化后的数字数据以一定的格式记录下来。编码的方式很多,常用的编码方式是脉冲编码调制(pulse code modulation,PCM)
优点:抗干扰能力强、失真小、传输特性稳定
缺点:编码后的数据量比较大
CD-DA采用的就是这种编码方式
2、数字音频的技术指标
数字音频的技术指标一共有三个:采样频率、量化位数、声道数。前两项已在上述描述过,这里主要介绍声道数
声音是有方向的,而且通过反射产生特殊效果。当声音到达左右耳的相对时差和不同的方向感觉不同的强度,这就是立体声效果
声道数值声音通道的个数。单声道只记录和产生一个波形;双声道产生两个波形,也即立体声,存储空间是单声道的两倍
记录每秒存储声音容量的公式为:
采样频率率(Hz)* (采用精度(bit)/ 8) *声道数 = 每秒数量量(字节数)
例如:用44.10kHz的采样频率,每个采样点用16位精度存储,则录制1s的立体声(双声道),其WAV文件所需存储量为:
44100*(16/8)*2=176.4KBps
3、数字音频的文件格式
(一)WAV(.wav)文件
简介:微软公司采用的波形声音文件存储格式
存储模式:波形声音文件
来源:外部音源(话筒、录音机)录制
特点:直接记录了真实的二进制采样数据,文件较大
用途:多用于存储简短声音片段
(二)MIDI(.mid)文件
简介:是乐器数字接口(musical instrument digital interface)的英文缩写,把电子乐器与计算机相连接制定的规范,是数字音乐的国际标准
存储模式:将乐器弹奏的每一个音符记录为一串数字,由声卡上的合成器处理后再由扬声器播放
特点:文件紧凑、文件较小
在多媒体应用中,一般WAV文件存放解说词,MIDI文件存放的是背景音乐。
(三)MP3(.mp3)文件
简介:MP3格式是采用MPEG音频压缩标准进行压缩的文件。MPEG是一种标准,全称为moving pictures expert group,即移动图像专家组,是比较流行的一种音频、视频多媒体文件标准。
特点:高品质、低采样率、压缩比较高、音质接近CD、制作简单、便于交换。非常适合在网上传播,是目前使用最多的音频格式文件。
扩展名:.mp3
上述的WAV和MIDI格式文件均可以压缩成MPEG格式文件
(四)RA(.ra)文件
简介:RA(real audio)是real network公司制定的音频压缩规范,有较高的压缩比,采用流媒体的方式在网上实时播放
(五)WMA(.wma)文件
简介:wma(windows media audio)是微软公司新一代的windows平台音频标准,压缩比高,音质强于MP3和RA格式,适合网络实时播放
二、图形和图像编码
1、基本概念
在计算机中图形(graphics)和图像(image)是一对既具有联系又有区别的概念,它们都是一幅图,但是图的产生、处理、存储方式不同
图形:值通过绘图软件绘制的由直线、圆、圆弧、任意曲线等图元组成的画面,以矢量图形文件形式存储。
矢量图文件中存储的是一组描述各个图元的大小、位置、形状、颜色、维数等属性的指令集合,通过相应的绘图软件读取这些指令可将其转换为输出设备上显示的图形。
矢量图文件的最大优点:对图形中的各个图元进行缩放、移动、旋转而不失真,而且所占存储空间小
图像:图像是由扫面议、数字照相机、摄像机等输入设备捕捉的真实场景画面产生的映像,数字化后以位图形式存储。
位图文件中存储的是构成图像的每个像素点的亮度、颜色
位图文件的大小与分辨率和色彩中的颜色种类有关,放大、缩小都要失真,占用的空间要比矢量文件大。
矢量图易于转化为位图,但是位图难以转化为矢量图
2、图像数字化
(一)采样
采样就是将二维空间上连续的图像转化成离散的过程,采样的实质就是用多少个像素点来描述这一幅画,称之为图像的分辨率,用“列数*行数”表示,分辨率越高,图像越清晰,存储量越大。
(二)量化
量化则是在图像离散化后,将表示图像色彩浓淡的连续变化值离散化为整数值的过程。把量化时所确定的整数值取值个数称为量化级数,表示量化的色彩值(或亮度)所需的二进制位数称为量化字长。一般可用8位、16位、24位、32位等来表示图像的颜色,24位可以表示224=1677216中颜色,称为“真彩色”。
在多媒体计算机中,图像的色彩值称为图像的颜色深度,有多重色彩表示:
a:黑白图:图像的颜色深度为1,则用一个二进制位1和0表示纯白和纯黑两种模式
b:灰度图:图像的颜色深度为8,占一个字节,灰度级别为256级。通过调整黑白两色的程度(称颜色灰度)来有效的显示单色图像
c:RGB:24位真彩色彩色图像显示时,由红、绿、蓝三基色通过不同的强度混合而成,当强度分成256级(值0-255),占24位,就构成了224=1677216中颜色的“真彩色”图像。
(三)编码
将采样和量化后的数字数据转换成二进制数码0和1表示的形式。
图像的分辨率和像素位的颜色深度决定了图像文件的大小,计算公式为:
行数*列数*颜色深度/8=图像字节数
例1:当要表示一个分辨率为1280*1024的“24位真彩色”图像,则图像大小为多少MB? 1280*1024*24/8 =3932160B=3840KB=3.75MB
例2:一副分辨率为800*600的黑白图像,存储是需要占用多少KB?
分析:黑白图像的颜色深度为1
解: 800*600*1/8 = 58.6KB
3、图形图像文件格式
(一)BMP(.bmp)文件
简介:BMP(bitmap位图)是一种与设备无关的图像文件格式,是windows环境中经常使用的一种位图模式。
特点:包含图像信息丰富,几乎不进行压缩。占用磁盘空间过大。
目前BMP在单机上比较流行
(二)GIF(.gif)文件
简介:GIF(graphics interchange format,图形交换格式)是美国联机服务商compuserve针对当时网络传输带宽的限制,开发出的图像格式
特点:压缩比高、磁盘空间占用少。不能存储超过256色的图像。支持“渐显模式”方式,是internet上www中的重要文件格式之一。
(三)JPEG(.jpg)文件
简介:JPEG(joint photographic experts group,联合照片专家组)是利用JPEG方法压缩的图像格式。
特点:压缩比高,但压缩/解压缩算法复杂、存储和显示速度慢。同一图像的BMP格式的大小是JPEG的5倍,而GIF又最大只支持256色,因此载入256色以上的图像、使用与处理大幅面图像的JPEG格式成为internet中最受欢迎的图像格式
JPEG 2000 是JPEG的升级版,其压缩率比JPEG高30%。与JPEG不同的是JPEG2000同时支持有损压缩和无损压缩,而JPEG只支持有损压缩。无损压缩对保存一些重要的图片十分有用。
(四)WMF(.wmf)文件
简介:WMF(windows metafile format)是windows中常见的一种图元文件格式
特点:文件短小、图案造型化的特点,整个图形由各个独立的组成部分拼接而成,但其图形往往粗糙。
windows中许多剪贴画图像是以该格式存储的,广泛应用于桌面出版印刷领域。
(五)PNG(.png)格式文件
简介:PNG(portable network graphics,移植的网络图像)是流式图像文件
特点:压缩比率高,无损压缩,适合在网络传播,支持alpha通道透明图像制作,可以使图像与网页背景融为一体。缺点是不支持动画功能。
点击关注新浪微博:@乡村教师胡劲