[无监督式学习]-自学习目标分类器/检测器探究

最新推荐文章于 2024-07-21 20:24:26 发布

董程森

最新推荐文章于 2024-07-21 20:24:26 发布

阅读量681

点赞数 2

分类专栏：机器学习文章标签：聚类机器学习深度学习人工智能

本文链接：https://blog.csdn.net/qq_36229876/article/details/106549907

版权

机器学习专栏收录该内容

13 篇文章 2 订阅

订阅专栏

开始做新项目啦QAQ

一些背景知识

什么是无监督式，监督式学习？

在正文开始前，我想搞懂这个问题是非常重要的。在目前的机器学习领域，大概把训练(/学习)过程分为三类，一类是监督式学习，一类是半监督式学习，一类是无监督式学习。自学习目标分类器/检测器正是属于无监督式学习的范畴。半监督式学习在这里就不展开说了。下面大概说一下自己对剩下两种模式的理解：

监督式学习

顾名思义，就是人为提供数据与标定。比如在目标分类中，每张图片标定一个onehot编码/数字索引。在目标检测中每张图片提供一些bounding box坐标。以上的这些把数据人为标定上一定的值，输入网络，进行训练，从而拟合出一个合适的数据关于标定的“公式” 的思路，称为监督式学习。

无监督式学习

不提供标定好的数据，直接向网络输入数据，由网络根据输入数据，进行特征提取，从而输出结果。意义：有些数据人工无法标定；有些数据，人工标定的难度太高。

自学习目标分类器

在探究了自学习目标分类器后，我觉得它应该算是最简单的无监督式学习demo了。它的主题思想如下:

训练

将矩阵输入backbone后得到fmap，再将fmap做聚类。不过此处有个地方，我还是不太理解。就是在数据不确定的情况下，如何用手肘法确定合适的K值。(后面再仔细想想)

预测

经过聚类后，假设我们得到了n个类别。此时，便完成了学习的过程(特征提取并分类)。之后，我们便可以进入预测。假设此时有一个图像矩阵输入网络，得到了fmap。我们的目标是为了得到这个fmap的类别(即图像矩阵的类别)。而再上一步中，我们已经通过聚类获得了n个类别了。那么，判断这个fmap的类别也非常简单了。我们只需计算这个fmap和n个类别中心点的距离，找出距离最小值所对应的类别中心点索引，就可以实现对fmap类别的分类。