目录
首先:文中有废话,有缺失是必然的,大家听我bb几分钟,不如看看👇
时隔好久,我又回来更新了
一方面是又学到了新的干货,
一方面是把我学到的内容和big data的同学们分享一下,希望对大家课设有所帮助
1.分类模型评估
1.1 准确率(accuracy)
准确率一般用于评价分类器,是正确分类的样本数与总样本数之比
from sklearn.metrics import accuracy_score
# y_true是指真实值
# y_pred模型根据数据(一般是训练集数据)得出的预测值
print('Accuracy score: ', format(accuracy_score(y_test, y_pred)))
1.2 精确率和召回率和F1值
已有的定义和公式我就不说了,接下来我说点人话
混淆矩阵相关的概念也有很多,在此同样略过
说的笼统且不专业一点:
精确率(precision),也称查准率,P = 预测对的/(预测对的+预测错的)
召回率(recall),即查全率,F = 预测对的/(预测对的+没预测出来的)
F1是precision和recall的调和均值 F1 = 2PR/(P+R)
P & R都很高时,F1也会很高
from sklearn.metrics import precision_score, recall_score,f1_score
print('Accuracy score: ', accuracy_score(y_test, predictions))
print