性能度量就是衡量模型泛化能力的评价标准
在机器学习的预测任务中,可以分为两类:
- 回归(regression):预测的值是连续的,比如某地区的房价预测任务
- 分类(classification):预测的值是离散的,比如猫狗图片的二分类任务,可以用0表示猫,1表示狗
回归任务
回归任务最常用的性能度量是“均方误差”(Mean Square Error, MSE)
设 ( x i , y i ) (x_i, y_i) (xi,yi)表示第i个样本, x i x_i xi是输入的向量(由各个特征值构成), y i y_i yi是正确的输出值,f表示学习器学得的模型, f ( x i ) f(x_i) f(xi)表示该模型的预测值,则整个样例集D的“均方误差”可表示为:
M S E = 1 m ∑ i = 1 m ( f ( x i ) − y i ) 2 MSE = \frac{1}{m}\sum_{i=1}^{m}(f(x_i) - y_i)^2 MSE=