一、监督学习
偏差和方差就像飞镖射到靶子上。每个飞镖就是从不同数据集得出的预测结果。高偏差、低误差的模
型就是把飞镖扔到了离靶心很远的地方,但是都集中在一个位置。而高偏差、高误差的模型就是把飞
镖扔到了靶子上,但是飞镖离靶心也很远,而且彼此间很分散。低偏差、高误差的模型就是把飞镖扔
到了离靶心很近的地方,但是聚类效果不好。最后就是低偏差、低误差的模型,把飞镖扔到了离靶心
很近的地方,聚类效果也很好
在理想情况下,模型具有低偏差和低误差,但是二者具有背反特征,即要降低一个指标的时候,另一
个指标就会增加。这就是著名的偏差-方差均衡(Bias-Variance Trade-off)。
二、无监督学习
没有误差项要评估,其效果的是评估数据结构的一些属性
机器学习系统应该可以这样评估:用系统在真实世界中发生错误的代价来表示效果评估方法。
真阳性 真阴性 假阳性 假阴性四个结果可以用来计算分类系统效果的评价体系,包括准确率(accuracy),精确率(precision)和召回率(recall)三项指标
TP是真阳性统计结果,TN是真阴性统计结果,FP是假阳性统计结果,FN是假阴性统计结果:
准确率:
ACC =TP + TN/(TP + TN + FP + FN)精确率:
P =TP/(TP + FP)
召回率:
R =TP/(TP + FN)