SIFT的原理及使用

最新推荐文章于 2023-08-04 09:11:22 发布

Naturino

最新推荐文章于 2023-08-04 09:11:22 发布

阅读量683

点赞数

分类专栏：基础知识 # 机器学习文章标签：计算机视觉 opencv 图像处理

本文链接：https://blog.csdn.net/Naturino/article/details/128660077

版权

基础知识同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

机器学习

3 篇文章 0 订阅

订阅专栏

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

一、介绍

SIFT算法的基本思路是在图像中检测关键点，然后对每个关键点计算描述符。
具体来说，SIFT算法包括以下几个步骤：

关键点检测：使用高斯金字塔和DOG(Difference of Gaussian)在不同尺度上检测关键点
关键点描述：对每个关键点周围的像素计算梯度直方图来描述关键点
关键点匹配：利用描述符来匹配关键点

SIFT算法的优点在于它能够检测出图像中的关键点，并且具有尺度不变性和旋转不变性。也就是说，SIFT算法能够在图像的尺度和旋转变化的情况下检测出相同的关键点，这使得它在很多应用中非常有用。

1 关键点检测

SIFT算法的关键点检测主要使用了高斯金字塔和DOG(Difference of Gaussian)。

高斯金字塔：首先使用高斯滤波器对图像进行降采样，得到不同尺度的图像。然后使用拉普拉斯金字塔对这些图像进行差分，得到不同尺度的差分图像，这些差分图像称为DoG图像。
DOG：在DoG图像中检测关键点，在每个像素处计算它在当前层和相邻层的差值，如果这个像素是极值点，就认为它是关键点。
筛选：对于检测出的关键点，使用更严格的筛选标准进行进一步筛选，比如对像素值进行比较以及形态学运算等。
精确定位：对于筛选出来的关键点，使用Taylor展开进行精确定位，确定关键点的坐标

SIFT算法在这些步骤中都非常细致地考虑了尺度不变性，保证了检测到的关键点能够在图像尺度变化的情况下被重复检测到，使得算法具有很高的鲁棒性。

2 关键点描述

关键点描述是指在SIFT算法中，对于每个检测到的关键点计算一个描述符，用来表示这个关键点周围的像素信息。这个描述符可以用来表示关键点的特征，并且可以用来将关键点与其他图像中的关键点进行匹配。

SIFT算法中的关键点描述是通过计算关键点周围像素的梯度直方图来实现的。

具体来说，SIFT算法会在关键点附近设置一个小窗口，并在这个窗口中进行梯度计算。然后将计算得到的梯度直方图分成8个方向和4个尺度，并分别计算每个方向和尺度上的梯度直方图。最后将这些直方图组合成一个高维向量作为关键点的描述符。

这些描述符构成的向量可以用来表示关键点的特征，因为它们包含了关键点周围像素的梯度信息。这些描述符可以用来将关键点与其他图像中的关键点进行匹配。

在匹配中,两个关键点越相似,那么他们的描述符越相似，这样就可以通过比对描述符的相似度来判断两个关键点是否是同一个特征点.

这个描述符的高维向量也叫做特征向量，它可以用来表示图像中的特征，可以进行图像识别，图像检索等应用。

3 关键点匹配

SIFT算法中的关键点匹配是通过对比两张图像中关键点描述符的相似度来实现的。

具体来说，对于两张图像中的每个关键点，都会有一个描述符向量。将两张图像中的描述符向量进行匹配，找出最匹配的两个向量，并计算它们的相似度。如果相似度足够高，就认为这两个关键点是对应的。

SIFT算法中通常使用欧氏距离来衡量两个向量的相似度,相似度越小,代表两个向量越相似。

为了提高匹配的准确性，还可以使用RANSAC算法来进行关键点匹配。 RANSAC是一种随机抽样一致性算法，它可以通过随机选择一些匹配对来估计变换矩阵，并通过验证其余的匹配对来确定最佳变换矩阵。这样可以有效地消除误匹配，提高匹配的准确性。

总结一下，SIFT算法中的关键点匹配步骤包括:

计算两张图像中每个关键点的描述符向量
将两张图像中的描述符向量进行匹配，找出最匹配的两个向量
计算这两个向量的相似度，如果相似度足够高，就认为这两个关键点是对应的
通过RANSAC算法来进行关键点匹配

这样就可以在两张图像中找到对应的关键点，进而进行图像拼接，图像识别等应用。

二、使用SVM对SIFT特征进行分类

1 原理

SIFT算法提取的特征包括关键点和描述符两部分，关键点可以用来确定图像中特征的位置，而描述符则可以用来表示图像中特征的具体信息。

SVM需要的是数值型特征向量，而关键点的信息是离散的，需要在坐标上进行表示，显然不能直接用来进行分类。而描述符则可以直接转换为数值型特征向量，所以一般使用描述符来进行SVM分类。由于SIFT提取的描述符是高维向量。因此，需要对SIFT提取的特征进行降维处理。

最常用的降维方法之一是PCA(Principal Component Analysis)。PCA是一种常用的数据降维技术，它可以将原始数据投影到一组新的坐标系上，使得新坐标系中的数据具有最大的变异性。

PCA降维后的特征向量是连续型的，需要进行离散化处理，以便于SVM进行分类。常用的离散化方法有均匀量化和非均匀量化。均匀量化是将数据划分为等大小的几个区间，非均匀量化是根据数据的分布特点来划分区间。

另外,需要将所有的特征向量标准化，这样才能让SVM算法正确的计算出分类决策面。

在进行降维，离散化，标准化后，SIFT提取的特征就可以转换成SVM所希望的输入了。可以通过将这些格式化后的特征和标签一起作为SVM的输入进行训练和分类。

2 代码样例（Python）

下面举个例子：

import cv2
from sklearn.decomposition import PCA
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split

# 读取图像
img = cv2.imread("image.jpg")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 创建SIFT对象
sift = cv2.xfeatures2d.SIFT_create()

# 提取特征
keypoints, descriptors = sift.detectAndCompute(gray, None)

# 将描述符和标签分别存放在X和y中
X = descriptors
y = labels

# 创建PCA对象
pca = PCA(n_components=k) #n_components表示降维后的维度数

# 进行降维
X_pca = pca.fit_transform(X)

# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X_pca , y, test_size=0.2)

# 创建SVM分类器
clf = SVC(kernel='linear')

# 训练模型
clf.fit(X_train, y_train)

# 预测
y_pred = clf.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)