有监督、无监督学习概念

最新推荐文章于 2024-08-22 22:53:18 发布

driver1999

最新推荐文章于 2024-08-22 22:53:18 发布

阅读量2.2k

点赞数 1

分类专栏：数据结构与算法文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_43603028/article/details/106642173

版权

10 篇文章 0 订阅

订阅专栏

机器学习分为：监督学习，无监督学习，半监督学习等。

标签：如果你输入了关键词（动物，会飞，有翅膀），怎么让机器知道这个是鸟呢？答案是不可能，除非你提前告诉计算机，说一种动物，会飞，有翅膀，这就是鸟。这个“告诉“的过程叫做打标签(labelling), 这个其实就是对数据的定义。

有标签的就是有监督学习。
已经标记好的数据(labelled data)，用来做训练来预测新数据的类型(class)，或者是值。预测已有类型叫做分类(classification)，预测一个值叫做回归(regression)。
常见的有监督学习算法：回归分析和统计分类。

有监督学习方法必须要有训练集与测试样本。在训练集中找规律，而对测试样本使用这种规律。而非监督学习没有训练集，只有一组数据，在该组数据集内寻找规律。
有监督学习的方法就是识别事物，识别的结果表现在给待识别数据加上了标签。因此训练样本集必须由带标签的样本组成。而非监督学习方法只有要分析的数据集的本身，预先没有什么标签。如果发现数据集呈现某种聚集性，则可按自然的聚集性分类，但不予以某种预先分类标签对上号为目的。
非监督学习方法在寻找数据集中的规律性，这种规律性并不一定要达到划分数据集的目的，也就是说不一定要“分类”。这一点是比有监督学习方法的用途要广。譬如分析一堆数据的主分量，或分析数据集有什么特点都可以归于非监督学习方法的范畴。
用非监督学习方法分析数据集的主分量与用K-L变换计算数据集的主分量又有区别。后者从方法上讲不是学习方法。因此用K-L变换找主分量不属于无监督学习方法，即方法上不是。而通过学习逐渐找到规律性这体现了学习方法这一点。在人工神经元网络中寻找主分量的方法属于无监督学习方法。