图像处理知识点整理|多媒体技术与应用

鸣176

已于 2023-06-07 00:38:25 修改

阅读量505

点赞数

文章标签：图像处理计算机视觉人工智能

于 2023-06-06 23:54:57 首次发布

本文链接：https://blog.csdn.net/weixin_56249886/article/details/131059029

版权

思考题

1、Suppose we need to quantize 8-bit gray image to 2-bit accuracy, what is the simplest method? Which range of gray value in the original image is mapped to which quantization value? （假设我们需要量化8位的灰度图像到2位精度，最简单的方法是什么？原图像中灰度值的哪个范围映射到哪个量化值? ）
最简单的方法是使用四舍五入的方式将8位灰度值除以2^6=64，并向下取整到最接近的2位精度的值。具体来说，将每个8位的灰度值除以64，然后向下取整到最接近的2位精度的值，得到的结果可以是0、1、2、3，这四个量化值对应的灰度范围分别是0~ 63、64~ 127、128~ 191、192~ 255。例如，灰度值为76的像素将被量化为1，它的灰度范围是64~127。

2、Suppose there are 24 bits available for a color image, but the sensitivity of human eyes to red and green is 1.5 times that of blue. How can we use these bits better?
假设对一幅彩色图像，有24位可以利用，然而人眼对红色、绿色的敏感度是蓝色的1.5倍，该如何更好地使用这些位？

对于彩色图像，一般采用RGB颜色模型来表示，其中每个像素的颜色由红、绿、蓝三个分量组成，每个分量占8位，共24位。由于人眼对红色和绿色的敏感度比蓝色高1.5倍，因此可以考虑优化RGB颜色模型，以更好地利用这24位，同时提高图像的视觉感受质量。
一种改进的方法是采用YUV颜色模型，其中Y分量表示亮度，U和V分量表示色度。在YUV颜色模型中，U和V分量是基于红色和蓝色的差异进行编码的，因此可以考虑将U分量的位数调整为7位，而将V分量的位数调整为6位，以更好地利用这24位。具体地，可以将RGB颜色值转换为YUV颜色值，然后将U和V分量分别量化为7位和6位，最后再将YUV颜色值转换回RGB颜色值。
这种方法虽然可以更好地利用24位，但是需要注意的是，由于每个像素的颜色信息被分成了三个分量，因此在进行图像处理时需要特别注意三个分量之间的关系，以避免出现颜色失真、色彩偏移等问题。此外，YUV颜色模型也不是所有情况下都比RGB颜色模型更优秀，具体选用哪种颜色模型需要根据实际情况进行评估和选择。

除了YUV颜色模型，还有一种叫做Lab颜色模型的颜色空间可以更好地利用人眼对颜色的敏感度。Lab颜色空间是一种可感知均匀的颜色空间，L表示亮度，a和b分别表示红绿色度和黄蓝色度。Lab*颜色空间中的颜色值是由三个参数组成的，每个参数的取值范围都是[-128, 127]，可以使用24位来表示。
在Lab颜色空间中，颜色的感知距离与其在空间中的距离成正比，因此在Lab颜色空间中，两个颜色之间的距离可以更好地反映它们在人眼中的感知差异。因此，将RGB颜色空间转换为Lab颜色空间，并在Lab颜色空间中进行图像处理，可以更好地利用24位，并且可以获得更好的视觉感受质量。
需要注意的是，由于Lab颜色空间是一种非线性的颜色空间，因此在进行图像处理时需要注意使用适当的算法和工具。此外，Lab颜色空间中的a和b分量的取值范围都是[-128, 127]，因此需要进行归一化处理，以便使用24位来表示。

数字图像处理的历史和应用

约有75%的信息是通过视觉系统获取的。
20世纪20年代: 报纸业Bartlane 电缆图片传输系统；
20世纪20年代中期到末期: 改进Bartlane 系统后，图像质量得到了提高；
20世纪70年代: 数字图像处理开始应用于医学领域：– 1979: Godfrey N. Hounsfield先生以及Allan M. Cormack 教授由于发明了“断层（CT）技术” ，共同获得了诺贝尔医学奖，其背后的思想是计算机轴向断层技术(Computerised Axial Tomography (CAT))；
20世纪70年代末:随着人工智能的兴起和发展，开始计算机视觉的研究，由2D图象中获取3D空间信息；
20世纪80年代至今：数字图像处理技术呈爆炸性发展，如今已在大量领域担负着大量的工作。
应用举例：地球资源勘探、遥感图片、气象云图、气象预报、农林业应用、军事应用（如目标跟踪、隐形飞机、定位轰炸）、交通监控、自动驾驶、印刷电路板检测、工业检验（工业可视化系统）、法律执行（拍照识别、指纹识别、闭路电视中图像增强）、人机交互（面部识别、手势识别）、超声图像、红外图像、广告设计、网页设计、影视。
GIS地理信息系统
全球夜间灯光数据集

总结

应用领域：
通信：图像传输，电视电话，HDTV等。
宇宙探测：星体图片处理。
遥感：地形、地质、矿藏探查，森林、水利、海洋、农业等资源调查，自然灾害预测，环境污染的监测，气象云图。
生物医学：CT，NMR，PET，SPECT，DSA，X射线成象，B超，红外图像，显微图像。
工业生产：产品质量检测，生产过程控制，CAD，CAM。
军事：军事目标侦察，制导系统，警戒系统，自动火器控制，反伪装等。
公安：现场照片，指纹，手迹，印章，人像等处理和鉴别。
档案：过期的文字、图片档案的修复和处理。
机器人视觉
娱乐：电影特技，动画，广告，MTV等。

专业名词

采样与量化
获取图像的目标是从感知的数据中产生数字图像，但传感器的输出是连续的电压波形，因此需要把连续的感知数据转换为数字形式。这一过程由图像的取样与量化来完成。数字化坐标值称为取样，数字化幅度值称为量化。
数字图像
将一幅二维的图像通过有限个离散点来表示就成为了数字图像，其中的每个点称为图像元素，即像素。
分辨率resolution/清晰度
位图
位图，表示图像数据的二位像素值数组。
真彩色：真彩色是指在组成一幅彩色图像的每个像素值中，有R，G，B三个基色分量，每个基色分量直接决定显示设备的基色强度，这样产生的彩色称为真彩色。
伪彩色：每个像素的颜色不是由每个基色分量的数值直接决定，而是把像素值当作彩色查找表(调色板)的表项入口地址，去查找一个显示图像时使用的R，G，B强度值，用查找出的R，G，B强度值产生的彩色称为伪彩色。
马赫带效应：是1868年奥地利物理学家 E.马赫发现的一种明度对比的视觉效应。是一种主观的边缘对比效应。当观察两块亮度不同的区域时，边界处亮度对比加强，使轮廓表现得特别明显。
对比度对比度是指最亮的亮度和最暗的亮度之间的比值。
在这里插入图片描述
半色调halftone的方法
阈值抖动：假设所有像素的灰度值介于0和1之间，对于每个像素点，将灰度值大于阈值设为1，小于阈值的设为0。
（PS：点画法利用了半色调原理。）
随机调制：在阈值处理之前给每个像素添加一个随机的量——通常从[-a, a]中添加均匀随机的量。为了获得更好的结果，添加更好质量的噪声，例如，使用高斯噪声(从正态分布中采样的随机值)。
有序抖动
将抖动矩阵转化为阈值矩阵
在这里插入图片描述
通过阈值法应用抖动算法

矩阵的大小和值的排列对抖动过程有重要的影响。两种常见的抖动矩阵模式:集群模式和分散模式。
集群模式:如果连续的阈值位于空间接近，那么它被称为“集群模式”。
特性：
相对可见的纹理
细节呈现相对较差
均匀纹理跨越整个灰度
非理想输出器件的稳健性能
分散模式:阈值在矩阵中均匀分布。
特性：
在任何包含K个点的区域内，K个阈值应尽可能均匀分布。
用于表示单个灰度级别的纹理具有低可见度。
改进细节再现。
不同灰度级别对应的纹理之间的过渡可能更明显。
对非理想输出设备不可靠
误差传播
误差扩散算法是一种常用的图像处理技术，它用于将灰度图像量化为二值图像，即黑白图像。该算法的基本思想是将每个像素的误差传递到周围的像素中，从而实现更平滑的图像效果。常用的误差扩散算法包括Floyd-Steinberg、Jarvis-Judice-Ninke和Stucki等。
在使用误差扩散算法时，需要根据具体情况选择合适的算法和阈值，以获得最佳的图像处理效果。同时，误差扩散算法也不适用于所有图像，特别是对于含有大量细节的图像，误差扩散算法可能会导致图像失真和信息丢失。
误差=灰度值-真实值
右侧、下侧的像素需要加上当前像素的误差*权重再处理。

鸣176

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
图像处理知识点整理|多媒体技术与应用

应用领域通信：图像传输，电视电话，HDTV等。宇宙探测：星体图片处理。遥感：地形、地质、矿藏探查，森林、水利、海洋、农业等资源调查，自然灾害预测，环境污染的监测，气象云图。生物医学：CT，NMR，PET，SPECT，DSA，X射线成象，B超，红外图像，显微图像。工业生产：产品质量检测，生产过程控制，CAD，CAM。军事：军事目标侦察，制导系统，警戒系统，自动火器控制，反伪装等。公安：现场照片，指纹，手迹，印章，人像等处理和鉴别。档案：过期的文字、图片档案的修复和处理。机器人视觉娱乐。
复制链接

扫一扫