性能度量
对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型繁华能力的评价标准,这就是性能度量。在给定样例集,其中
是示例
的真实标记,要评估学习器
的性能,就是要把学习器输出的结果
与真实标记
进行比较。
1. 均方误差
在回归任务中最常用的性能度量是“均方误差”:
2. 错误率与精度
这是分类任务中最常用的两种性能度量,适用于二分类以及多分类任务。对于样例集D,分类错误率定义为
对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型繁华能力的评价标准,这就是性能度量。在给定样例集,其中
是示例
的真实标记,要评估学习器
的性能,就是要把学习器输出的结果
与真实标记
进行比较。
1. 均方误差
在回归任务中最常用的性能度量是“均方误差”:
2. 错误率与精度
这是分类任务中最常用的两种性能度量,适用于二分类以及多分类任务。对于样例集D,分类错误率定义为