机器学习-分类问题
在分类问题中,预测的变量 y 是离散的值,学习一种叫做逻辑回归 (Logistic Regression) 的算法
1.分类:例如:判断一封电子邮件是否是垃圾邮件;判断一次金融交易是否是欺诈;区别一个肿瘤是恶性的还是良性的。
2.二分类问题
因变量可以记为:y∈{0,1} 0 表示负向类,1 表示正向类
注意:0和1 分别定义为邮件是否为垃圾邮件,以及肿瘤是否为良性或者恶性都是任意的。
3.多分类问题
首先假如将线性回归应用与分类问题的话
在上图这种情况下可以看出是比较好的,还是可以用来进行分类的,我们设置阈值为0.5,大于0.5 预测因变量为1 小于0.5 预测因变量为0.
但是如果加上另外一个点,如下图所示,情况就不是这个样子了。
进行回归以后,
这种情况下,很显然回归问题就不能用于分类问题了。