多媒体
考点:
1.音频和图形图像的相关概念
2.多媒体相关计算问题
3.常见多媒体标准
4.压缩技术
音频和图形图像的相关概念
- 音频相关
- 声音三要素
- 音量:声音的强度
- 音调:声音的频率
- 音色:由混入基音的泛音决定
- 频率范围
- 人耳能够听到的频率范围:20Hz~20kHz
- 乐器的音频范围:20Hz~20kHz
- 人说话的音频范围:300Hz~3400Hz
- 次声波、超声波
- 采样、采样频率、采样精度
- 采样频率:每秒采样的次数。采样时间的倒数(横坐标)
- 采样精度:采样位数,对信号的编码的位数(纵坐标)
- 为了使采样不失真,采样频率必须是最高频率的2倍
- 图形和图像相关
- 图形:矢量图,放大不会失真,比较小
- 图像:位图,放大会失真,比较大
- 三原色原理
- 彩色空间
- RGB彩色空间:电脑等电子产品的显示
- YUV彩色空间:电视机
- CMY彩色空间:打印
多媒体相关计算问题
- 图像文件大小的计算:图像是采用点阵(像素)来描述的,而在存储时也是针对点阵进行描述。对于每个点阵,采用n为来表示其颜色,位数越高可以表示的色彩越丰富。
- 音频大小的计算:
- 视频文件大小的计算:视频文件其实就是连续的图像,因此计算时只需计算每帧图像所需的存储容量,然后乘以每秒的帧数,在乘以时间
常见的多媒体标准
- MPEG系列
- mp3:MPEG-1的第3层的音频编码标准
- MPEG-7:多媒体内容描述接口
- 常见的图像/图片有以下几种:
- BMP(无压缩)
- DIB/PCX
- DIF(CAD矢量图)
- WMF/GIF
- JPEG(余弦函数压缩)
- PSD/CDR/PCD
- 常见的音频格式
- WAVE(无压缩)
- MOD
- MP3:MPEG1-Layer3
- Real Audio:压缩比高,适合网络传输
- CD Audio:CD上的音频格式,可以很好保持原声,但格式大
- MIDI:音乐数字接口,可以模仿乐器声音,但不能模仿人声
- 常见的视频格式
压缩技术
- 冗余:数据之所以能够压缩是因为基本原始信源的数据存在着很大的冗余度。一般来说有以下种类的数据冗余
- 空间冗余(几何冗余):例如一张图片中大范围相同的颜色
- 时间冗余:例如一段视频中长时间不变的背景
- 视觉冗余:人眼看不到的信息
- 信息熵冗余:信源编码的熵大于信源的实际熵,就认为存在信息熵冗余
- 结构冗余:例如一张图片存在多个相同的结构
- 知识冗余:图像中存在的一些客观规律
- 压缩
- 无损压缩:可以还原(zip/rar压缩是无损压缩)
- 有损压缩:不可以还原(jpeg/mp3是有损压缩,mp3丢掉了一些人耳听不到的声音)