Classification(分类问题)
分类
:根据已知样本的某些特征,判断一个新的样本属于哪种已知的样本类
基本框架
y = f(x1,x2…xn) 判断为类别N,如果y = n
分类方法 逻辑回归 KNN紧邻模型 决策树 神经网络
分类任务与回归任务的明显区别
分类任务
- 分类目标:判断类别
- 模型输出:非连续型标签(pass/failed;0/1/2)
回归任务
- 回归目标:建立函数关系
- 模型输出:连续型数值(比如0-20000的任意数值)
逻辑回归
用于解决分类问题的一种模型
。根据数据特征或属性,计算其归属于某一类别的概率P(x),根据概率数值判断其所属类别。主要应用场景:二分类问题
区分类别散点图
mask=y