西瓜书学习记录（二）模型评估与选择下

最新推荐文章于 2024-07-25 11:02:16 发布

墨鱼mo

最新推荐文章于 2024-07-25 11:02:16 发布

阅读量54

点赞数

性能度量是用来衡量模型泛化能力的标准，在对比不同模型的能力时，使用不同的性能度量往往会导致不同的评判结果。

在回归任务中，即预测连续值的问题，最常用的性能度量是“均方误差”（mean squared error）,很多的经典算法都是采用了MSE作为评价函数。

在分类任务中，即预测离散值的问题，最常用的是错误率和精度，错误率是分类错误的样本数占样本总数的比例，精度则是分类正确的样本数占样本总数的比例，易知：错误率+精度=1。

错误率和精度虽然常用，但不能满足所有的需求，例如：在推荐系统中，我们只关心推送给用户的内容用户是否感兴趣（即查准率），或者说所有用户感兴趣的内容我们推送出来了多少（即查全率）。因此，使用查准/查全率更适合描述这类问题。对于二分类问题，分类结果混淆矩阵与查准/查全.

在比较学习器泛化性能的过程中，统计假设检验（hypothesis test）为学习器性能比较提供了重要依据，即若A在某测试集上的性能优于B，那A学习器比B好的把握有多大。为方便论述，本篇中都是以“错误率”作为性能度量的标准。

偏差与方差

偏差-方差分解是解释学习器泛化性能的重要工具。在学习算法中，偏差指的是预测的期望值与真实值的偏差，方差则是每一次预测值与预测值得期望之间的差均方。实际上，偏差体现了学习器预测的准确度，而方差体现了学习器预测的稳定性。通过对泛化误差的进行分解，可以得到：

期望泛化误差=方差+偏差
偏差刻画学习器的拟合能力
方差体现学习器的稳定性

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
西瓜书学习记录（二）模型评估与选择下

性能度量是用来衡量模型泛化能力的标准，在对比不同模型的能力时，使用不同的性能度量往往会导致不同的评判结果在回归任务中，即预测连续值的问题，最常用的性能度量是“均方误差”（mean squared error）,很多的经典算法都是采用了MSE作为评价函数，...
复制链接

扫一扫

墨鱼mo CSDN认证博客专家 CSDN认证企业博客

码龄5年

42: 原创

43万+: 周排名

62万+: 总排名

3万+: 访问

: 等级

597: 积分

6: 粉丝

21: 获赞

11: 评论

131: 收藏

私信

关注

热门文章

分类专栏

leetcode
论文笔记 1篇

最新评论

C#模拟微信抢红包
游子吟i: 有问题，最好将红包金额乘以100来计算
【动手深度学习】线性回归的实现
崔老鳖: 为什么我在第一个代码块部分显示散点图那个地方内核总是挂掉了
【笔记】【LSTM算法】一、Keras的简介
风影诗人: 膜拜学霸，整理的真板正
transformer一些题目
weixin_52050619: 这句话怎么理解：矩阵加法的加法计算相对简单，但是作为transformer的隐层，整体的计算量和点乘差不多，即两者的计算复杂度相差不多
【动手深度学习】线性回归的实现
PSP?: 这是在pycharm中运行的吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。