图像处理知识点整理|多媒体技术与应用

思考题

1、Suppose we need to quantize 8-bit gray image to 2-bit accuracy, what is the simplest method? Which range of gray value in the original image is mapped to which quantization value? (假设我们需要量化8位的灰度图像到2位精度,最简单的方法是什么?原图像中灰度值的哪个范围映射到哪个量化值? )
最简单的方法是使用四舍五入的方式将8位灰度值除以2^6=64,并向下取整到最接近的2位精度的值。具体来说,将每个8位的灰度值除以64,然后向下取整到最接近的2位精度的值,得到的结果可以是0、1、2、3,这四个量化值对应的灰度范围分别是0~ 63、64~ 127、128~ 191、192~ 255。例如,灰度值为76的像素将被量化为1,它的灰度范围是64~127。

2、Suppose there are 24 bits available for a color image, but the sensitivity of human eyes to red and green is 1.5 times that of blue. How can we use these bits better?
假设对一幅彩色图像,有24位可以利用,然而人眼对红色、绿色的敏感度是蓝色的1.5倍,该如何更好地使用这些位?

对于彩色图像,一般采用RGB颜色模型来表示,其中每个像素的颜色由红、绿、蓝三个分量组成,每个分量占8位,共24位。由于人眼对红色和绿色的敏感度比蓝色高1.5倍,因此可以考虑优化RGB颜色模型,以更好地利用这24位,同时提高图像的视觉感受质量。
一种改进的方法是采用YUV颜色模型,其中Y分量表示亮度,U和V分量表示色度。在YUV颜色模型中,U和V分量是基于红色和蓝色的差异进行编码的,因此可以考虑将U分量的位数调整为7位,而将V分量的位数调整为6位,以更好地利用这24位。具体地,可以将RGB颜色值转换为YUV颜色值,然后将U和V分量分别量化为7位和6位,最后再将YUV颜色值转换回RGB颜色值。
这种方法虽然可以更好地利用24位,但是需要注意的是,由于每个像素的颜色信息被分成了三个分量,因此在进行图像处理时需要特别注意三个分量之间的关系,以避免出现颜色失真、色彩偏移等问题。此外,YUV颜色模型也不是所有情况下都比RGB颜色模型更优秀,具体选用哪种颜色模型需要根据实际情况进行评估和选择。

除了YUV颜色模型,还有一种叫做Lab颜色模型的颜色空间可以更好地利用人眼对颜色的敏感度。Lab颜色空间是一种可感知均匀的颜色空间,L表示亮度,a和b分别表示红绿色度和黄蓝色度。Lab*颜色空间中的颜色值是由三个参数组成的,每个参数的取值范围都是[-128, 127],可以使用24位来表示。
在Lab颜色空间中,颜色的感知距离与其在空间中的距离成正比,因此在Lab颜色空间中,两个颜色之间的距离可以更好地反映它们在人眼中的感知差异。因此,将RGB颜色空间转换为Lab颜色空间,并在Lab颜色空间中进行图像处理,可以更好地利用24位,并且可以获得更好的视觉感受质量。
需要注意的是,由于Lab颜色空间是一种非线性的颜色空间,因此在进行图像处理时需要注意使用适当的算法和工具。此外,Lab颜色空间中的a和b分量的取值范围都是[-128, 127],因此需要进行归一化处理,以便使用24位来表示。

数字图像处理的历史和应用

约有75%的信息是通过视觉系统获取的。
20世纪20年代: 报纸业Bartlane 电缆图片传输系统;
20世纪20年代中期到末期: 改进Bartlane 系统后,图像质量得到了提高;
20世纪70年代: 数字图像处理开始应用于医学领域:– 1979: Godfrey N. Hounsfield先生以及Allan M. Cormack 教授由于发明了“断层(CT)技术” ,共同获得了诺贝尔医学奖,其背后的思想是计算机轴向断层技术(Computerised Axial Tomography (CAT));
20世纪70年代末:随着人工智能的兴起和发展,开始计算机视觉的研究,由2D图象中获取3D空间信息;
20世纪80年代至今:数字图像处理技术呈爆炸性发展,如今已在大量领域担负着大量的工作。
应用举例:地球资源勘探、遥感图片、气象云图、气象预报、农林业应用、军事应用(如目标跟踪、隐形飞机、定位轰炸)、交通监控、自动驾驶、印刷电路板检测、工业检验(工业可视化系统)、法律执行(拍照识别、指纹识别、闭路电视中图像增强)、人机交互(面部识别、手势识别)、超声图像、红外图像、广告设计、网页设计、影视。
GIS地理信息系统
全球夜间灯光数据集

总结

应用领域
通信:图像传输,电视电话,HDTV等。
宇宙探测:星体图片处理。
遥感:地形、地质、矿藏探查,森林、水利、海洋、农业等资源调查,自然灾害预测,环境污染的监测,气象云图。
生物医学:CT,NMR,PET,SPECT,DSA,X射线成象,B超,红外图像,显微图像。
工业生产: 产品质量检测,生产过程控制,CAD,CAM。
军事: 军事目标侦察,制导系统,警戒系统,自动火器控制,反伪装等。
公安: 现场照片,指纹,手迹,印章,人像等处理和鉴别。
档案: 过期的文字、图片档案的修复和处理。
机器人视觉
娱乐
: 电影特技,动画,广告,MTV等。

专业名词

采样与量化
获取图像的目标是从感知的数据中产生数字图像,但传感器的输出是连续的电压波形,因此需要把连续的感知数据转换为数字形式。这一过程由图像的取样与量化来完成。数字化坐标值称为取样,数字化幅度值称为量化。
数字图像
将一幅二维的图像通过有限个离散点来表示就成为了数字图像,其中的每个点称为图像元素,即像素。
分辨率resolution/清晰度
位图
位图,表示图像数据的二位像素值数组。
真彩色:真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。
伪彩色:每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(调色板)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值,用查找出的R,G,B强度值产生的彩色称为伪彩色。
马赫带效应:是1868年奥地利物理学家 E.马赫发现的一种明度对比的视觉效应。是一种主观的边缘对比效应。当观察两块亮度不同的区域时,边界处亮度对比加强,使轮廓表现得特别明显。
对比度对比度是指最亮的亮度和最暗的亮度之间的比值。
在这里插入图片描述
半色调halftone的方法
阈值抖动:假设所有像素的灰度值介于0和1之间,对于每个像素点,将灰度值大于阈值设为1,小于阈值的设为0。
(PS:点画法利用了半色调原理。)
随机调制:在阈值处理之前给每个像素添加一个随机的量——通常从[-a, a]中添加均匀随机的量。为了获得更好的结果,添加更好质量的噪声,例如,使用高斯噪声(从正态分布中采样的随机值)。
有序抖动
将抖动矩阵转化为阈值矩阵
在这里插入图片描述
通过阈值法应用抖动算法
在这里插入图片描述
矩阵的大小和值的排列对抖动过程有重要的影响。两种常见的抖动矩阵模式:集群模式分散模式
集群模式:如果连续的阈值位于空间接近,那么它被称为“集群模式”。
特性:
相对可见的纹理
细节呈现相对较差
均匀纹理跨越整个灰度
非理想输出器件的稳健性能
分散模式:阈值在矩阵中均匀分布。
特性:
在任何包含K个点的区域内,K个阈值应尽可能均匀分布。
用于表示单个灰度级别的纹理具有低可见度。
改进细节再现。
不同灰度级别对应的纹理之间的过渡可能更明显。
对非理想输出设备不可靠
误差传播
误差扩散算法是一种常用的图像处理技术,它用于将灰度图像量化为二值图像,即黑白图像。该算法的基本思想是将每个像素的误差传递到周围的像素中,从而实现更平滑的图像效果。常用的误差扩散算法包括Floyd-Steinberg、Jarvis-Judice-Ninke和Stucki等。
在使用误差扩散算法时,需要根据具体情况选择合适的算法和阈值,以获得最佳的图像处理效果。同时,误差扩散算法也不适用于所有图像,特别是对于含有大量细节的图像,误差扩散算法可能会导致图像失真和信息丢失。
误差=灰度值-真实值
右侧、下侧的像素需要加上当前像素的误差*权重再处理。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值