监督学习
- 百度给的定义是指:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。
- 监督学习是从已经标记的训练数据(比如我们有一个监督学习算法,我们对于输入的图像来说,我们是已知它的类别的)来推断一个功 能的机器学习任务。
- 输入了一个值,我们输出一个值,其所在的监督学习算法是分析该训练数据,我们得到了一个映射,我们使用这个映射可以进行分类。我们使用这个映射对于我们需要检测的数据进行检测。
- 标记的训练数据:我们的样本是特征(比如图像),标签(比如图像的类别)这两者,我们使用数据集中的特征与其对应的标签,我们调整分类器的参数,我们不断重复这个过程,分类器的精准度会一般会不断的提高。
- 输入一个新的特征向量,对于这个新的特征向量,得到其标签。
- 监督学习在神经网络的,决策树算法里面有应用。
无监督学习
对于我们要使用的数据集的特征与标签之间的的关系,我们是未知的。其中的关系对于我们要通过某种操作(比如聚类)来获得。无监督学习机器要自己学习,无监督学习是没有标签让算法进行比对的。
K聚类是一种典型的无监督学习
K聚类算法
1 首先将数据分成K组,我们随机的选取K个对象作为最开始的聚类中心。
2 计算每个对象与聚类中心的聚类,我们把对象分配给离它最近的聚类中心。
3 一次分配完成以后,我们重新选取聚类中心,然后继续分配。
4 迭代这个过程,迭代的终止条件是我们终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
我们使用K聚类算法可以实现对于图像的分割,K(分类的类别数)是由我们自己指定