6.1 Classification —— 分类
下面是分类问题的一些例子:
- 判断一封电子邮件是否是垃圾邮件;
- 判断一次金融交易是否是欺诈;
- 判断一个肿瘤是恶性的还是良性的。
在所有这些问题中,我们需要预测的是一个变量y。我们将因变量(dependent variable)可能属于的两个类分别称为负类(negative class)和正类(positive class),则因变量y ∈{0,1},其中 0 表示负类,1 表示正类。正、负类的指定是任意的,并不重要。从直观的感觉上,负类一般用来表示“没有”,正类一般表示“有”。接下来先讨论二分类问题,后面的课程中还会讨论多类分类问题(multi-class classification problem),那时y可能有多种可能的分类。
如何建立一个分类算法?