计算机文化基础(第十讲)学习笔记
采样和量化PictureElement
Pixel(像素)(链接:
采样的实质就是要用多少点(这个点我们叫像素)来描述一张图像,比如,一幅420x570的图像,就表示这幅图像是由293400个点所组成。
量化是指要用多大范围的数值,来表示图像采样之后每一个点的色彩信息。例如用3个bits存储一个点,表示该图像只能用8种颜色来表现
多媒体数据的信息量举例1
一页印在B5(约180mm×255mm)纸上的文件,若以中等分辨率(300dpi)的扫描仪进行采样,其数据量约6.1Mb,一片650MB的CD-ROM,可存848页。
1inch=25.4mm
图像像素点的个数=(300×180)÷25.4×(300×255)÷25.4
每个像素点量化位为1bit/24bit.
黑白图像文件大小=6403063×1÷1024÷1024=6.1Mb
真彩色图像文件大小6403063×24÷1024÷1024=147Mb
多媒体数据的信息量举例2
双通道立体声激光唱盘(CD-A),采样频率为44.1KHz,采样精度(量化)16位/样本。其一秒时间内的采样位数为1.35Mb/s,一个650Mb的CD-ROM,可存约1小时的音乐。
文件每秒存储量(字节/秒)=采样频率(Hz)×采样精度(位)×声道数/8
44.1×10³×16×2÷8=176400B/s=1.35Mb/s
一个650Mb的CD-ROM可存音乐:
650×8÷1.35÷60÷60=1.07H
多媒体数据压缩的必要性
数字化后的信息,尤其是数字化后的视频和音频信号具有数据的海量性,它给信息的存储和传输造成较大的困难,成为阻碍人类有效的获取和使用信息的瓶颈问题之一。
因此研究和开发新兴的有效的多媒体数据压缩编码方法,以压缩的形式存储和传输这些数据将是最好的选择。
多媒体数据压缩的可能性
信息量与数据量的关系:
I=D-du
I——信息量
D——数据量
du——冗余量
数据冗余是指信息所具有的各种性质中多余的无用空间,其多余的冗余程度叫做“冗余度”。
图像数据的冗余性
l空间冗余规则物体的表面具有物理相关性,将其表面数据化后表现为数据冗余。
l时间冗余视频信号和动画一般为位于一时间区间的一组连续画面,其中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置有所不同,所以后一帧的数据与前一帧的数据有许多共同的地方,这种共同性是由于相邻帧记录了相邻时刻的同一场景画面。
l结构冗余有些图像的纹理区,图像的像素值存在着明显的分布模式。例如方格状的地板图案等。我们称此为结构冗余。已知分布模式,可以通过某一过程生成图像。
l知识冗余有些图像的理解与某些基础知识有相当大的相关性,例如,人脸的图像有固定的结构,这类规律性的结构,可有先验知识和背景知识得到,我们称此类冗余为知识冗余。根据已有的知识,我们可以构造其基本模型,并创建对应各种特征的图像库。进而图像的存储只需要保存一些特征参数,从而可以大大减少数据量。知识冗余是模型编码主要利用的特性。
l视觉冗余人类视觉系统对于图像场的任何变化并不是都能感知的。
1.人类视觉系统对亮度变化敏感,而对色度的变化相对不敏感。
2.在高亮度区,人眼多亮度变化敏感度下降。
3.对物体边缘敏感,内部区域相对不敏感。
4.对整体结构敏感,而队内部细节相对不敏感。
数据压缩的条件
l信息冗余冗余即是相同或相似信息的重复。可以在空间范围重复,也可以在时间范围重复,可以是严格重复,也可以是以某种相似性重复。冗余分为统计冗余和心理视觉听觉冗余两大类。
l人类不敏感因素
对某些频率的音频信号不敏感;
人眼也存在“视觉掩盖效应”,即对亮度比较敏感,而对边缘的强烈变化不敏感;并且对彩色细节的分辨能力远比亮度细节的分辨能力低。
数据压缩与概率
数据压缩是用编码实现的
数据压缩算法的理论基础
传统的压缩编码是建立在香农(C.E.Shannon)信息论的基础上,它以经典的集合论为基础,用统计概率模型来描述信源,但是它未考虑信息接受者的主观特性及事件本身的具体含义,重要程度和引起的后果。压缩编码的发展历程实际是以香农信息论为出发点,不断完善的过程。
行程编码算法
行程编码(RLE,Run-length encoding)
原则:重复的数据值序列(或称为“流”)用一个重复次数和单个数据值来代替。
常用编码格式
控制符
重复次数
被重复对象
例如,字符串
RTAAAASDEEEEE经RLE压缩后为:
RT*4ASD*5E
预测编码原理
预测编码是根据离散信号之间存在着一定关联性的特定,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。
压缩评价指标
衡量一种压缩技术的三个重要指标
l压缩比要大
l恢复效果要好,要尽可能的恢复原始数据。
l实现压缩的算法要简单,压缩解压速度快,竟可能的做到实时压缩、解压。
从技术应用目的评价压缩指标
l面向存储的技术
l面向传输的技术
多媒体数据压缩编码的国际标准
l音频编码技术标准:G系列标准
lJPEG,连续色调静止图像压缩标准
lH.261,H.263,适用于ISDN上的会议电视/可视电话
lMPEG系列标准
运动图像压缩编码标准MPEG
1.MPEG系列标准
MPEG专家小组承担制定了可用于数字存储介质上的视频及其关联音频的国际标准。
2MPEG1:着眼于解决多媒体的存储问题。
l用于数据速率高达大约1.5Mbit/s的数字存储媒体的活动图像和伴音编码。
l视频数据压缩率1/100-1/200,音频压缩率为1/6.5.
lMPEG1t提供每秒30帧352*240分辨率的图像。
MPEG-1音频压缩
MPEG-1音频压缩利用编码技术,将源文件重新进行编码压缩,其次是利用数据压缩,将人类听觉中的不敏感部分删除,从而达到缩小文件尺寸的目的。音频层根据压缩质量和编码复杂度分为Layer 1 , Layer2 , Layer3三层
。
■MPEG-1Audio Layer3
ISDN声音传输1:10——1:12压缩比■MPEG-1Audio Layer2
数字广播声音、CD、
VCD、数字音乐1:6——1:8压缩比■MPEG-1Audio Layer1
数字盒式磁带1:4压缩比■Wave原始文件