本系列文章由孙旭编辑,转载请注明出处
http://blog.csdn.net/longyindiyi/article/details/20068781
多谢合作!
如果您在阅读文章过程中发现有表述错误的地方,还请指正。
根据上一节的知识,不难看出,模式识别的核心任务是——分类。
这一节我们通过一个识别动物种类的简单例子,说明一下分类的基本类别和方法。
一般地,分类问题可以分为两类和多类两种,如下图所示:
有人可能就要问了,为什么要把两类问题专门独立出来呢?
首先,两类问题是分类问题中最简单的一种。其次,很多多类问题可以被分解为多个两类问题进行求解(请看下文分解)。所以,历史上有很多算法都是针对两类问题提出的。
现在,我们看看多类问题的几种处理方式。
1.直接分成多类
2.间接分成多类 I
3.间接分成多类 II
可以实现直接分多类的算法并不多,典型的有神经网络。而由后两种方法,可以看出二分类问题的重要性,这类算法典型的有支撑向量机。
解决分类问题,就是用某个算法在训练数据上学习,得出的模型或规则——分类器。然后就可以用该分类器对测试数据进行分类了。用框图表示如下:
在经典统计模式识别中,分类器的设计有两种思路:基于判别函数的分类器和基于距离的分类器。
对于这两类分类器及其代表算法,将在后面的文章逐一为各位呈现。