回归问题的评价指标

最新推荐文章于 2024-08-09 12:44:11 发布

闵帆

最新推荐文章于 2024-08-09 12:44:11 发布

阅读量178

点赞数 2

分类专栏：计算机数学基础文章标签：机器学习

本文链接：https://blog.csdn.net/minfanphd/article/details/118189755

版权

计算机数学基础专栏收录该内容

14 篇文章 8 订阅

订阅专栏

在机器学习中, 令输入为 $\mathbf{X} = (\mathbf{x}_1, \mathbf{x}_2, \dots, \mathbf{x}_n)^{\mathrm{T}} \in \mathcal{R}^{n \times m}$ , 输出 (标签) 为 $\mathbf{Y} = (y_1, y_2, \dots, y_n)^{\mathrm{T}} \in \mathcal{R}^n$ . 回归器为一个函数 $\mathcal{R}^m \rightarrow \mathcal{R}$ . 为了最小化 mean absolute error (MAE), 优化目标可以写为
$\min \frac{\sum_{i = 1}^n |y_i - f(\mathbf{x}_i)|}{n} \tag{1}$
其实这里是否除以 $n$ 都没有关系, 反正对不同回归器都是一样的.
为了最小化 root mean squared error (RMSE), 优化目标可以写为
$\min \sqrt{\frac{\sum_{i = 1}^n ( y_i - f(\mathbf{x}_i))^2}{n}} \tag{2}$
这里根号要不要也没关系, 对不同回归器也是一样的.
注: 如何增加正则项, 避免过拟合, 在此不作讨论.

如果我们去掉累加操作、除以 $n$ 操作和取根号操作, 上面两式所使用的函数 (称为 loss function) 可改写为
$f_1(y_i, f(\mathbf{x}_i)) = |y_i - f(\mathbf{x}_i)| \tag{3}$
和
$f_2(y_i, f(\mathbf{x}_i)) = (y_i - f(\mathbf{x}_i))^2 \tag{4}$
进一步, 它们使用的函数分别为
$f_3(v) = |v| \tag{5}$
和
$f_4(v) = v^2 \tag{5}$

使用更一般的函数
$f_5(v) = |v|^p \tag{6}$
当 $p = 1$ 时, 它退化为 $f_3$ , 即对应于 1 范数.
当 $p = 2$ 时, 它退化为 $f_4$ , 即对应于 2 范数.
当 $p = 0$ 时, 令
$v^0 = \left\{\begin{array}{ll}0 & \textrm{if } v = 0\\ 1 & \rm{otherwise}\end{array}\right.$
它退化为数非 0 元素的个数, 即为 0 范数.

物理意义: $p$ 值越大, 少数大的 $v$ 值 (可认为对应于 outlier) 对总体性能影响越大; $p$ 值为 $0$ 的时候, 只要是没完全准确预测, 效果都是一样的, outlier影响降到最低.
cost 的观点: 在这里 cost 和 loss 是一致的. loss function $f$ 也可以看作是 cost function.