95.图像特征点

目录

        1 什么是特征

        2 图像特征

        3 特征描述子

        4 图像尺度空间理论

        1 什么是特征

        对于每个物体,我们总能用一些词语描述它,比如人脸的特征:一个鼻子、两个眼睛、一个嘴巴等。对于计算机而言,图像的特征包括图像的颜色特征、纹理特征、形状特征等。

        我们希望计算机去理解图像、描述图像,这就需要计算机去取得图像的特征,这个特征也要是一些显著、良好的特征,比如局部不变性。局部不变性一般包括两个方面:尺度不变性、旋转不变性。

        尺度不变性: 人类在识别一个物体时,不管这个物体或远或近,都能对它进行正确的辨认,这就是所谓的尺度不变性。

        旋转不变性: 当这个物体发生旋转时,我们照样可以正确地辨认它,这就是所谓的旋转不变性。

        2 图像特征

        全局特征: 从整个图像中抽取的特征。较多的运用在图像检索领域,如图像颜色直方图。

        局部特征: 从图像的局部区域中抽取的特征(这个局部区域往往是图像中的一个像素及它周围的邻域)。 一种好的局部特征应该具有以下特性:

        1)可重复性:同一个物体在不同时间,不同角度拍到图像中,检测到的特征对应的越多越好。

         2)独特性:特征在该物体上表现为独特性,能与场景下其他物体区分。

        3)局部性:特征往往是物体某个局部的特点,这样才可以避免遮挡时不能匹配的问题。

        4)数量性:检测到的特征数目一定要多,密集度最好能在一定程度上反映图像的内容。

        5)准确性:得到的特征应该能被精确定位,能够精确到像素。

        3 特征描述子

        特征描述子是用于表征图像中的特征点的一种表示方法。它们通过对特征点周围区域进行采样和计算,将其转化为一个具有固定维度的向量或特征向量。

        特征描述子的目的是捕捉特征点周围的局部纹理、形状或光度信息,并保持一定程度的不变性,使得相似的特征点在描述子空间中具有较小的距离。这样可以实现特征匹配、图像检索、目标识别和跟踪等任务。

        常见的特征描述子包括SIFT(尺度不变特征转换)、SURF(加速稳健特征)、ORB(Oriented FAST and Rotated BRIEF)以及深度学习方法如CNN特征。这些描述子通常具有以下特点:

        尺度不变性:对图像缩放具有不变性,能够处理不同尺度下的特征点。

        旋转不变性:对图像旋转具有不变性,能够处理不同角度下的特征点。

        光度不变性:对图像亮度变化具有不变性,能够处理光照变化下的特征点。

        局部性:只关注特征点周围的局部区域,减少计算量和噪声干扰。

        特征描述子的计算通常是在特征点周围的图像区域内进行,可以使用各种方法,如梯度方向直方图(Histogram of Oriented Gradients, HOG)、局部二值模式(Local Binary Patterns, LBP)和卷积神经网络(Convolutional Neural Networks, CNN)等。这些算法都有助于提取并表示特征点的关键信息,从而实现图像处理与分析中的各种任务。

        4 图像尺度空间理论

        在一定的范围内,无论物体是大是小,人眼都能分辨出来。然而在未知场景中计算机并不知道物体的尺度大小,其中的一种方法是把物体不同尺度下的图像都提供给机器,让机器能够对物体在不同的尺度下有一个统一的认知。在建立统一认知的过程中,要考虑的就是在图像在不同的尺度下都存在的特征点。

        1)多分辨率图像金字塔: 早期图像的多尺度通常使用图像金字塔表示。图像金字塔是同一图像在不同的分辨率下得到的一组结果,其生成过程一般包括两个步骤:

        1.图像平滑

        2.降采样

        多分辨率的图像金字塔虽然生成简单,但其本质是降采样,图像的局部特征则难以保持,也就是无法保持特征的尺度不变性。

        2)高斯尺度空间: 通过图像的模糊程度来模拟人在距离物体由远到近时物体在视网膜上成像过程,距离物体越近其尺寸越大图像也越模糊。

        使用不同的参数模糊图像(分辨率不变),是尺度空间的另一种表现形式。

        图像和高斯函数进行卷积能够对图像进行模糊,使用不同的高斯核可得到不同模糊程度的图像。一副图像的高斯尺度空间可由其和不同的高斯卷积得到:

        其中,G(x,y,σ)是高斯核函数,σ 称为尺度空间因子,它是高斯正态分布的标准差,反映了图像被模糊的程度,其值越大图像越模糊,对应的尺度也就越大。L(x,y,σ)代表着图像的高斯尺度空间。 构建尺度空间的目的是为了检测出在不同的尺度下都存在的特征点,检测特征点较好的算子是∆^2G(高斯拉普拉斯,LoG)

        通常采用DoG算子来近似计算:

        将相邻的两个高斯空间的图像相减就得到了DoG的响应图像。

        为了得到DoG图像,首先要构建高斯尺度空间:

        高斯金字塔的组数一般设置为:

        o表示高斯金字塔的组数,m、n分别是图像的行和列。减去的系数a可以在0~log2min(m,n)之间的任意值,和具体需要的金字塔的顶层图像的大小有关。 每组图像中的多个层之间的尺度不同(使用不同的σ ),相邻两层之间相差比例因子k,如果每组有S层,则k = 2^1/s。

        在得到图像的多尺度高斯金字塔后,我们再通过相同组不同尺度之间的高斯模糊图像相减,即可得到DoG金字塔:

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

别叭叭儿—好好学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值