图像识别与处理学习笔记(一) 入门直方图基础概念与图像增强

本文深入解析了数字图像的概念,包括采样量化、存储格式,重点讲解了灰度直方图、归一化及其在图像增强中的应用,涉及空间域增强(灰度变换、代数运算及滤波)、频率域增强,并展示了图像增强技术在直方图均衡、分割和分类中的实践。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


学习自:MOOC
在这里插入图片描述

1. 数字图像概念

1.1 图像采样和量化

数字图像主要是以像素为元素的矩阵,所以一副图像一般由矩阵行数 * 矩阵列数 * 像素位数来表示
在这里插入图片描述
主要是空间分辨率的采样(矩阵的大小)和亮度分辨率的量化(如灰度值的位数,一般256是8位分辨率)
空间分辨率

亮度分辨率

1.2 图像存储格式

主要有四种图像处理格式:

BMP:

在这里插入图片描述

JPEG:

在这里插入图片描述
主要是通过相关性,保留重要信息,背景进行极致压缩,所以压缩率高且保持了图像质量。

GIF:

在这里插入图片描述

PNG:

在这里插入图片描述

2.图像的直方图

2.1 灰度直方图

2.1.1 基本概念

统计该灰度值下的像素个数,所以nk的和即总的像素个数
在这里插入图片描述
在这里插入图片描述
灰度:把白色与黑色之间按对数关系分成若干级,称为“灰度等级”。范围一般从0到255,白色为255,黑色为0
在这里插入图片描述
上图可以发现同一灰度直方图可能有多个图像与之对应。并没有对图像的灰度值的位置出现有描述。

2.1.2灰度直方图归一化

归一化原因:由于各种图像的像素点个数不一样,所以利用归一化(该灰度值下像素的个数/总个数)表示该灰度值出现的概率
在这里插入图片描述

2.1.3 直方图应用

  1. 图像增强
    直方图均衡处理将图像进行细节提取
    在这里插入图片描述

  2. 图像分割
    在这里插入图片描述

  3. 图像分类
    对比直方图查看图像有无不同,如可以判断有无物体经过
    在这里插入图片描述

3.图像增强

3.1 图像增强概念

按照特定需要突出或者去除某些信息

3.2 图像增强方法

3.2.1 方法概述

在这里插入图片描述
应用实例:
在这里插入图片描述
第一、三、四幅图和是对灰度值进行灰度变换,使得灰度值变换到人眼敏感的范围。
第二幅图是对图像进行了滤波处理。

3.2.1 空间域增强

3.2.1.1 空间域增强(灰度变换)

直接对图像像素的灰度值处理

  • 普通的线性变换
    在这里插入图片描述
    对图像的灰度值进行区间平移伸缩处理。
    现象:
    在这里插入图片描述

  • 分段线性变换
    在这里插入图片描述
    对人眼敏感的灰度区间进行拉伸,不敏感区间进行压缩。
    在这里插入图片描述

  • 非线性变换(对数变换)
    在这里插入图片描述
    对数变换:灰度值低的部分(黑色)拉伸,灰度值高的部分(白色)压缩。使得偏向黑色的区域变得明显。
    在这里插入图片描述
    在这里插入图片描述

  • 非线性变换(幂次变换)
    在这里插入图片描述
    当幂的次数大于1时,与对数相反,使得偏白色的区域变得明显(变化大/斜率大)
    当幂的次数大于1时,与对数相通,使得偏黑色的区域变得明显(变化大/斜率大)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    那么非线性变换前后的直方图有什么联系呢???
    在这里插入图片描述
    假设D表示不同的灰度值,f即为灰度值变换前后的映射函数,H则表示图像灰度的直方图。因为灰度变换前后,该灰度值对应的像素个数是不变的。
    在这里插入图片描述
    所以存在上图变化,右上角即表示了灰度值的映射关系,横坐标为之前的灰度值,纵坐标是改变后的灰度值。例如DA映射后变为了DB,虽然灰度值发生了变化,但是在两者的对应邻域内的直方图所对应的纵坐标即像素个数和是一样的,由于进行了伸缩,所以概括就是积分是一样的。(正如图上的DA ~ DA+ΔDA对应到DB ~ DB+ΔDB)
    在这里插入图片描述
    进行取极限操作,假设区间取得非常小,积分就可以看作矩形的长乘宽。
    在这里插入图片描述
    灰度变换后图像直方图是变换前直方图与变换函数导数之比

应用:
在这里插入图片描述
所以出现了直方图均衡的方法:
在这里插入图片描述
即把像素个数平均分布在所有的灰度级上。所以只要求出f的映射关系,即可实现直方图均衡的目的。
在这里插入图片描述
这里的公式是求该灰度值的新映射(只能取整数),所以必然最后得到的只是大概的平均分布。
在这里插入图片描述
在这里插入图片描述
所以最后比较之前分布,变化到较为均匀的分布

3.2.1.2 空间域增强(代数运算)
  • 加法运算
    图像对应像素点相加
    应用:如果每个图像都会受到一个均值为0的随机噪声的影响,那么采集n副同样的图片,求均值,即可得到原始图像。

  • 减法运算
    两幅图像相减
    应用:分割特定区域、检测场景变换
    在这里插入图片描述

  • 乘法运算
    应用:获取图像特定部分(0和1运算掩模)
    在这里插入图片描述

3.2.1.3 空间域滤波

在这里插入图片描述
图像是是二维坐标,所以引入了二维离散卷积,说白了,卷积就是对应相乘。

均值滤波
在这里插入图片描述
均值滤波就相当每次从图像中取3*3大小的像素块,然后和h(m,n)对应相乘求和在/9,即对这九个像素点求平均。

高斯滤波
在这里插入图片描述
高斯滤波即加重与中心点关联大的像素点的重要性,弱化其他点,同时,由于进行了加权,所以最后/(1+2+1+2+4+2+1+2+1)16,突出细节点。

为什么是低通呢?
在这里插入图片描述
这里利用数字信号处理中的DTFT非周期性离散傅里叶变换来计算。Ω即为频域,L=3,我化解了一下没化解出最后一行的结果。
化出(1+2cosΩ)*e-jΩ

在这里插入图片描述
低通滤波实现的是图像平滑

中值滤波
在这里插入图片描述
在这里插入图片描述
使突出的亮(暗)点更接近它周边的点,消除孤立的亮度或暗点
去除噪声的同时,比较好地保留边缘
能够有效去除脉冲噪声(黑白点叠加在图像上)。

高通滤波(图像锐化) 与低通相反,实现的是微分运算,从而达到增强高频,突出边缘的目的。 因为图像是离散的,所以微分即求梯度。
一阶差分:
在这里插入图片描述
算子即函数映射
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
soble算子非常出名,在智能车比赛中也常用于提取赛道边界
在这里插入图片描述

二阶差分:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

一阶差分和二阶差分的区别:在这里插入图片描述
一阶导数可以检测图像中的某像素点是否在边缘上
二阶导数可以判断一个边缘像素点在亮或暗的一边
在这里插入图片描述
边缘定位指的应该是黑色亮色交界点,因为上图中sobel在边缘处都为正。

如图,sobel可以用左上角减去右下角,计算45度方向的梯度变化,所以用来判断边缘变化方向,拉普拉斯算子就做不到。

在这里插入图片描述

3.2.2 频率域增强

待续…

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值