图像内容分类
本章介绍图像分类和图像内容分类算法。首先,我们介绍一些简单而有效的方法和 目前一些性能最好的分类器,并运用它们解决两类和多类分类问题,
1 K 邻近分类法(KNN)
在分类方法中,最简单且用得最多的一种方法之一就是 KNN(K-Nearest Neighbor ,K 邻近分类法),这种算法把要分类的对象(例如一个特征向量)与训练集中已知类标 记的所有对象进行对比,并由 k 近邻对指派到哪个类进行投票。这种方法通常分类效 果较好,但是也有很多弊端:与 K-means 聚类算法一样,需要预先设定 k 值,k 值的 选择会影响分类的性能;此外,这种方法要求将整个训练集存储起来,如果训练集 非常大,搜索起来就非常慢。对于大训练集,采取某些装箱形式通常会减少对比的次 数 1 从积极的一面来看,这种方法在采用何种距离度量方面是没有限制的;实际上, 对于你所能想到的东西它都可以奏效,但这并不意味着对任何东西它的分类性能都很 好。另外,这种算法的可并行性也很一般。
1.2 用稠密 SIFT 作为图像特征
我们来看如何对图像进行分类。要对图像进行分类,我们需要一个特征向量来表示 一幅图像。在聚类一章我们用平均 RGB 像素值和 PCA 系数作为图像的特征向量; 这里我们会介绍另外一种表示形式,即稠密 SIFT 特征向量。
在整幅图像上用一个规则的网格应用 SIFT 描述子可以得到稠密 SIFT 的表示形
1.3 图像分类:手势识别