机器学习系列（5）——模型评估与选择方法

最新推荐文章于 2024-07-15 23:27:49 发布

陌简宁

最新推荐文章于 2024-07-15 23:27:49 发布

阅读量1.1k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ii719481781/article/details/108180389

版权

本文介绍模型评估与性能度量方法。

0x01、损失函数与风险函数

机器学习模型关于单个样本的预测值与真实值的差称为损失。损失越小，模型越好，如果预测值与真实值相等，就是没有损失。损失函数（或代价函数）度量模型一次预测的好坏，风险函数度量平均意义下模型预测的好坏。

1、常用的损失函数

（1）0-1损失函数（0-1 loss function）

$L(Y,f(X))=\left\{\begin{matrix} 1,~ Y \neq f(X) & \\ 0, ~Y = f(X) & \end{matrix}\right.$

（2）平方损失函数（quadratic loss function）

L(Y,f(X))=(Y-f(X))^2

（3）绝对损失函数（absolute loss function）

L(Y,f(X))=|Y-f(X)|

（4）对数损失函数（logarithmic loss function）或对数似然损失函数（log-likelihood loss function）

L(Y,P(Y|X))=-logP(Y|X)

损失函数值越小，模型就越好。由于模型的输入、输出 (X,Y) 是随机变量，遵循联合分布 P(X,Y) ，所以损失函数的期望是：

$R_{exp}(f)=E_{p}[L(Y,f(X))]=\int _{\chi \times \gamma }L(y,f(x))P(x,y)dxdy$

这是理论上模型 f(X) 关于联合分布 P(X,Y) 的平均意义下的损失，称为风险函数（risk function）或期望损失（expected loss）。学习的目标就是选择期望风险最小的模型。

给定一个训练数据集 $T=\left\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N) \right\}$ ，模型 f(X) 关于训练数据集的平均损失称为经验风险（empirical risk）或经验损失（empirical loss）记作：

$R_{emp}(f)=\frac{1}{N} \sum_{i=1}^{N}L(y_i,f(x_i))$

期望风险 $R_{exp}(f)$ 是模型关于联合分布的期望损失，经验风险

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。