一、音频相关概念
-
声音带宽:
1)人耳:20Hz-20kHz
2)说话:300-3400Hz
3)乐器:20Hz-20kHz
-
采样:
1)采样频率
2)采样精度
3)采样频率应为声音最高频率的2倍。
二、图像相关概念
-
亮度:图像明亮程度
-
色调(红,绿)
-
饱和度:颜色的鲜艳程度
-
彩色空间:
1)RGB:光的三原色,叠加原理。
2)YUV(电视,兼容)。
3)CMY(CMYK,K代表黑色):印刷三原色,相减原理,材料显示的颜色是无法吸收的颜色,即反射出的颜色。
4)HSV(HSB):艺术家彩色空间。
-
位图:像素点。
-
矢量图:图元。
-
DPI(Dots Per lnch,每英寸点数):是一个量度单位,用于点阵数码影像,指每一英寸长度中,取样、可显示或输出点的数目。
三、媒体的种类
- 感觉媒体:指人们接触信息的感觉形式。如:视觉、听觉、触觉、嗅觉和味觉等。
- 表示媒体:指信息的表示形式。如:文字、图形、图像、动画、音频和视频等。
- 显示媒体(表现媒体):表现和获取信息的物理设备。如:输入显示媒体键盘、鼠标和麦克风等;输出显示媒体显示器、打印机和音箱等。
- 存储媒体:存储数据的物理设备,如磁盘、光盘和内存等。
- 传输媒体:传输数据的物理载体,如电缆、光缆和交换设备等。
- 多媒体技术基本特征:数字化、集成性、交互性、围绕计算机而构成。
四、多媒体的计算问题
-
图像容量计算:
1)已知像素,位数:每个像素为16位,图像为640 × \times ×480像素,求容量:640 × \times ×480 × \times ×16 ÷ \div ÷8=614400B。
2)已知像素,色数:640 × \times ×480像素,256色的图像,求容量:640 × \times ×480 × l o g 2 ( 256 ) ÷ 8 \times log_{2}(256)\div8 ×log2(256)÷8=307200B。
-
音频容量计算:
1) 容 量 = 采 样 频 率 ( H z ) × 量 化 / 采 样 位 数 ( 位 ) × 声 道 数 ÷ 8 容量=采样频率(Hz)\times量化/采样位数(位)\times声道数\div8 容量=采样频率(Hz)×量化/采样位数(位)×声道数÷8
-
视频容量计算:
1) 容 量 = 每 帧 图 像 容 量 ( B y t e ) × 每 秒 帧 数 × 时 间 + 音 频 容 量 × 时 间 容量=每帧图像容量(Byte)\times每秒帧数\times时间+音频容量\times时间 容量=每帧图像容量(Byte)×每秒帧数×时间+音频容量×时间
-
细节:小写k=1000(采样,传输),大写K=1024(存储)。
五、常见多媒体标准
-
JPEG:有损、RGB转YUV、离散余弦。
-
JPEG-2000:有损/无损,压缩比更高,小波变换,医学图像应用。
-
MPEG-1:离散余弦,VCD,MP3,(帧内压缩采用基于DCT的变换编码技术,以便减少空间冗余信息;帧间压缩算法采用预测和插补法)。
1)帧内图像(I帧)
2)预测图像(P帧)
3)插补图像(B帧)
-
MPEG-2:离散余弦,Huffman,DVD,有线/卫星电视,AAC。
-
MPEG-4:网络应用/可视电话,无线通信,增强交互性,数码权限管理,多媒体传输集成框架。
-
MPEG-7:多媒体内容描述接口,具备描述功能,不是编码标准。
-
MPEG-21:融合不同协议,制定新标准,标准集成。
六、数据压缩技术基础
- 空间冗余(几何冗余)
- 时间冗余
- 视觉冗余
- 信息熵冗余
- 结构冗余
- 知识冗余
七、有损压缩和无损压缩
- 无损压缩:冗余压缩法或熵编码法,香农编码,变长编码(哈夫曼编码),行程编码,算术编码。
- 有损压缩:熵压缩法。