背景
我们在机器学习中如何评价一个模型的好坏?对于一个回归问题,可以使用MSE、RMSE、MAE、R方。对于一个分类问题,可以使用分类精准度。
分类算法的评价
对于极度偏斜的数据,只使用分类准确度是不能衡量的。需要使用混淆矩阵进行进一步分析(confusion matrix)
- 混淆矩阵
- 精准率
precision = TP / TP + FP - 召回率
recall = TP / TP + FN
from sklearn.metrics import confusion_matrix
confusion_matrix(y_test, y_log_predict)
from sklearn.metrics import precision_score
precision_score(y_test, y_log_predict)
from sklearn.metrics import recall_score
recall_score(y_test, y_log_predict)
回归算法的评价
-
MSE
均方误差
-
RMSE
均方根误差
-
MAE
平均绝对误差
from sklearn.metrics import mean_squared_error
from sklearn.metrics import mean_absolute_error
mean_squared_error(y_test, y_predict)
mean_absolute_error(y_test, y_predict)