kmeans特征提取原理，详细代码图解分析

最新推荐文章于 2024-08-11 16:00:02 发布

whiteinblue

最新推荐文章于 2024-08-11 16:00:02 发布

阅读量1.9w

点赞数 5

文章标签： kmeans特征提取

本文链接：https://blog.csdn.net/whiteinblue/article/details/27378513

版权

本文深入探讨了使用K-means算法进行特征提取的过程，包括K-means的目标、优化条件以及与其他特征学习算法的联系。通过实例介绍了K-means在图像特征学习中的应用，包括数据预处理、K-means聚类和特征提取步骤，特别是软编码的非线性映射方法。文章还展示了如何在CIFAR-10数据集上提取特征，并进行了数据的归一化和白化处理，以提高特征学习的效果。

摘要由CSDN通过智能技术生成

原理部分主要来自大牛zouxy09和trnadomeet两个人的博客；后面的代码详细讲解为自己精心编写

一、概述

非监督学习的一般流程是：先从一组无标签数据中学习特征，然后用学习到的特征提取函数去提取有标签数据特征，然后再进行分类器的训练和分类。之前说到，一般的非监督学习算法都存在很多hyper-parameters需要调整。而，最近我们发现对于上面同样的非监督学习流程中，用K-means聚类算法来实现特征学习，也可以达到非常好的效果，有时候还能达到state-of-the-art的效果。亮瞎了凡人之俗眼。

托“bag of features ”的福，K-means其实在特征学习领域也已经略有名气。今天我们就不要花时间迷失在其往日的光芒中了。在这里，我们只关注，如果要K-means算法在一个特征学习系统中发挥良好的性能需要考虑哪些因素。这里的特征学习系统和其他的Deep Learning算法一样：直接从原始的输入（像素灰度值）中学习并构建多层的分级的特征。另外，我们还分析了K-means算法与江湖中其他知名的特征学习算法的千丝万缕的联系（天下武功出少林，哈哈）。

经典的K-means聚类算法通过最小化数据点和最近邻中心的距离来寻找各个类中心。江湖中还有个别名，叫“矢量量化vector quantization”（这个在我的博客上也有提到）。我们可以把K-means当成是在构建一个字典D∊R^nxk，通过最小化重构误差，一个数据样本x⁽ⁱ⁾∊Rⁿ可以通过这个字典映射为一个k维的码矢量。所以K-means实际上就是寻找D的一个过程：

这里，s⁽ⁱ⁾就是一个与输入x⁽ⁱ⁾对应的码矢量。D^(j)是字典D的第j列。K-means毕生的目标就是寻找满足上面这些条件的一个字典D和每个样本x⁽ⁱ⁾对应的码矢量s⁽ⁱ⁾。我们一起来分析下这些条件。首先，给定字典D和码矢量s⁽ⁱ⁾，我们需要能很好的重构原始的输入x⁽ⁱ⁾。数学的表达是最小化x⁽ⁱ⁾和它的重构D s⁽ⁱ⁾。这个目标函数的优化需要满足两个约束。首先，|| s⁽ⁱ⁾||₀<=1，意味着每个码矢量s⁽ⁱ⁾被约束为最多只有一个非零元素。所以我们寻找一个x⁽ⁱ⁾对应的新的表达，这个新的表达不仅需要更好的保留x⁽ⁱ⁾的信息，还需要尽可能的简单。第二个约束要求字典的每列都是单位长度，防止字典中的元素或者特征变得任意大或者任意小。否则，我们就可以随意的放缩D^(j)和对应的码矢量，这样一点用都木有。