本节主要介绍了ML在解决一些基于基本的binary classification问题的问题上所使用的方法以及列举了一些这些问题所对应的例子。
最基本的问题:binary classification
简单的二元分类问题对应的应用例子主要有上一节提到的银行发卡问题,邮件分类问题等,该类问题解决过程中要求出的直线我们成为linear classifier(线性分类器)。
binary classification拓展:muticlass classification问题
多类分类问题是线性分类问题的一个一般化形式,HT Lin提出了一个coin recognition的例子,该例子的任务是根据size和mass将硬币分为1、5、10、25四个不同的class,这就区别于binary分类中的Yes/No两个class。该问题的应用还有手写数字识别,图像识别和email分类等。
output space的变化:regression
regression(回归)和classification的区别在于classification的output space是一个或多个离散值,而regression的output space则是在一个连续区间内的连续值,也就是说,classification的结果能够轻松地用一个直接写出元素的集合形式表现,但是regression的结果却只能用描述法的形式体现。在统计学中这种思想成为回归分析。在实际应用中的例子包括通过企业的data预测股票的走势,用气候的data预测气温等等。
比较复杂的应用:structured learning
对应于该问题举得一个例子是通过learning的方法感知句子的结构并判断句子语法的正确性,实际上这也是muticlass classification的一种变体。