目录
算法概述
总体分类,机器学习中的算法模型可以分两大类:
- 监督学习算法
- 无监督学习算法
监督学习
监督学习是指利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有导师训练。
在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种“合理”的方式从一种从训练数据到看不见的情况下形成。
监督学习中在给予计算机学习样本的同时,还告诉计算各个样本所属的类别。若所给的学习样本不带有类别信息,就是无监督学习。任何一种学习都有一定的目的,对于模式识别来说,就是要通过有限数量样本的学习,使分类器在对无限多个模式进行分类时所产生的错误概率最小。
常见的监督学习算法:
- 线性回归
- 逻辑回归
- 朴素贝叶斯
- KNN(最近邻算法)
- 决策树
- 支持向量机
- 某些可用于分类或预测功能的神经网络模型
无监督学习
如果缺乏足够的先验知识,难以人工标注类别,或者进行人工类别标注的成本太高,我们希望计算机能代我们完成这些工作。这样就引出了无监督学习——根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。
常见的无监督学习算法
- 系统聚类
- K-means
- K-中值聚类