3.学习成果的评价
3.1 分类的评价矩阵
准确率
(主要性能)
精确率
(以垃圾邮件为例,在预测为垃圾的邮件中,确实是垃圾邮件的比例)
召回率
(以垃圾邮件为例,在所有数据里所包含的垃圾邮件,被正确预测为垃圾邮件)
F值
(良好均衡性能)
混淆矩阵
(TP,TN,FP,TN)
多类别分类的平均均值:
(多类别分类的平均取值:微平均与宏平均)
微平均
精确率=(TP1+TP2+TP3)/(TP1+TP2+TP3+FP1+FP2+FP3)
宏平均
精确率=(精确率1+精确率2+精确率3)/3
分类模型对比
F,ROC,AUG(曲线)
3.2 回归的评价
3.2.1 均方根误差
3.2.2 可决系数
3.3 机器学习系统的A/B测试