多媒体数据表示理论
前言
图像是一类非常重要的多媒体数据,人类获取的信息70%来自视觉系统,所以在所有的多媒体数据中,图像提供的信息最多!但是,在图像数字化之后的数据量是非常大的,由于存储介质和传输的限制,我们必须对图像数据进行压缩!
而图像压缩是基于下面两个事实:
1.图像数据中有许多重复数据,可以使用数学方法表示这些重复数据
2.人眼的视觉系统对图像细节和颜色的辨认是有一定范围的,超过这个返回人眼就感受不出来了,所以可以吧超出的部分去掉
主要概念
1.分辨率
分辨率分为显示分辨率与图像分辨率
显示分辨率表示显示器能显示出的像素个数,是显示器的一个衡量指标。在我们显示器上调节的分辨率就是这个分辨率,比如现在常见的1280*720,表示显示器分成720行,每行含有1280个像素点,那么整个屏幕就含有1280*720=921600和像素点
图像分辨率是指组成一幅图像的像素密度的度量方法,图像大小固定,像素分辨率越高,图像包含的像素点就越多,图像就越逼真。dpi dots per inch在扫描彩色图像时,指定图像的分辨率,用每英寸多少个像素点表示 例如300dpi,8*10英寸的图像 有2400*3000个像素。
显示分辨率表示确定图像大小,图像分辨率表示图像像素浓度
2.像素深度
像素深度又叫色深,指定存储每个像素所用位数(bit)它决定每个像素可能有的颜色数,或者灰度级数(对灰度图像而言)
计算机常用的像素深度有1位,8位,24位,还有32位的,选用哪一种色深与应用领域有关
在用二进制数据表示像素时,往往还会加上属性位。RGB 5:5:5 用16位2个字节来表示一个像素数据,其中有一位就是属性位,就是最高位的bit,作用就是控制原图是否可见
32位表示一个像素时,RGB分别用8bit表示,剩下8bit为Alpha通道位,讲数值归一化后有一个预乘通道位的作用
3.真伪彩色
真彩色就是像素值直接表示RGB值
全彩色图像就是RGB8:8:8 因为这种数据量太大,一般都用RGB5:5:5
伪彩色的像素值是一个颜色地址,通过Color Look-Up Table CLUT 表来查找,这样产生的图像通常称为调色板图像,在调色板图像中有两个矩阵,一个是图形矩阵像素->CLUT表项入口地址,我理解为一个颜色索引,另一个矩阵为调色板矩阵,矩阵中每一个元素代表一个颜色
4.位图bit mapper image与矢量图vector based image
请记住:他们是计算机上图像的不同的表示方法,要深入理解这个表示方法一次,说明它们只是不同的显示图的一套理念
矢量图法用一系列的计算机指令来表示图像。
位图法是将一幅图分为许多个像素,每个像素用若干二进制位表示该像素的颜色,亮度和属性
矢量图侧重于绘制,创造,位图侧重于获取,去复制。
现实图像适用位图,人工图像例如地图适用矢量图
位图文件显示比矢量图快
5.灰度图像与彩色图像
灰度图像仅保留像素的亮度信息
彩色图像:
真彩色图像是24位像素表示,8位像素表示通常称为调色板图像
6.图像的颜色模型
发光的有源物体用RGB相加混色模型
不发光的无源物体用CMY相减混色模型
RGB相加混色模型与CMY相减混色模型有互补色,数值上互补, RGB111表示白,CMY000是白
HSL颜色模型 H色调 S饱和度 L亮度
windows定义了16种标准颜色,叫做16色VGA(Video Graphics Array)
7.彩色空间的线性变换
为了使用人的视觉特性,达到降低数据量的目的,
通常把RGB空间转换到其他空间去
目前采用的空间主要有三种YIQ,YUV,YCC
记录下RGB转换为YUV的转换关系
Y=0.299R+0.587G+0.114B
U=0.147R-0.289G+0.436B
V=0.615R-0.515G-0,.100B