目录
二、使用sklearn构建完整的机器学习项目
2.使用sklearn构建完整的分类项目
回归和分类问题
回归问题是连续的因变量,分类问题是离散变量。但都是从已知变量到未知变量的映射。分类问题可以在回归问题基础上增加归一化函数。
(1) 收集数据集并选择合适的特征
(2) 选择度量模型性能的指标
度量分类模型的指标:
- 准确率:分类正确的样本数占总样本的比例,即: A C C = T P + T N F P + F N + T P + T N ACC = \frac{TP+TN}{FP+FN+TP+TN} ACC=FP+FN+TP+TNTP+TN.
- 精度:预测为正且分类正确的样本占预测值为正的比例,即: P R E = T P T P + F P PRE = \frac{TP}{TP+FP} PRE=TP+FPTP.
- 召回率:预测为正且分类正确的样本占类别为正的比例,即: R E C = T P T P + F N REC = \frac{TP}{TP+FN} REC=