关于模型评估的一些简单回顾

最新推荐文章于 2024-04-16 16:33:19 发布

金融科技自习生

最新推荐文章于 2024-04-16 16:33:19 发布

阅读量518

点赞数

分类专栏：机器学习文章标签： ROC AUC P-R 召回率准确度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42147780/article/details/101554573

版权

机器学习专栏收录该内容

21 篇文章 0 订阅

订阅专栏

泛化性能：

泛化能力用来评价一个训练好的模型在未知数据上的表现好坏。

欠拟合与过拟合：

欠拟合：指的是模型训练不够，没有捕获到数据中有用的特征或者模式。（低偏差）

过拟合：模型过度训练，在训练数据上表现很好，在测试集上表现不佳。（高方差）

看下图：

左边：训练误差和测试误差都很高，代表欠拟合，偏差大。

右边：训练误差很低，但是测试误差很高，代表过拟合，方差大。

模型验证策略：

训练集-测试集（7-3分），训练集-验证集-测试集（小数据6-2-2，大数据98%-1%-1%）；

k-折交叉验证（k份）；留1法（k-折的特例，分成n份(n为样本数)）

大数据用训练集-验证集-测试集的划分方法，小数据用k-折或者交叉验证

评估模型性能

混淆矩阵、准确率、精确率、召回率

准确率只适合用来评价那些数据分布均衡，（比如正负样本五五分的数据），对于样本分布不均衡，准确率高不一定表示模型效果好（9999个正，1个负。不管如何全部预测为正，准确率就有99.99%）

P-R曲线：横坐标是召回率，纵坐标是精确度(查准率)

召回率和精确率是此消彼长，因此不好衡量，F1结合了两者：

$F_1=2\frac{P*R}{P+R}$

P是precision,R是Recall,F1分数越高越好。

ROC曲线：

AUC：ROC曲线下的面积,面积越大代表越好。

r（相关系数，皮尔逊相关系数，Pearson correlation coefficient)：度量两个变量之间的线性关系强度。正相关或者负相关，值域在[-1,1]之间，0表示非线性相关。

$r=\frac{\sum(x-\overline{x})(y-\overline{y})}{\sqrt{\sum(x-\overline{x})^{2}(y-\overline{y})^{2}}}$

可以先画散点图，查看数据分布情况，如果明显不线性相关就不要计算了。

R^2 :用来衡量模型拟合数据情况程度的指标，值越大越好。（就是皮尔逊相关系数 r 的平方，因此 R^2 的值在0-1之间）

1.也就是说因变量y的变化，有多大比例可以通过自变量x的变化来解释（拟合）。

2.也就是说在回归模型中，有多大的程度，我们的回归曲线拟合了真实数据的分布。

R^2 的值在0-1之间：0表示模型随机拟合，1表示拟合很好。

存在的问题：每增加一个特征，R方值会增加，但是并不意味它表现好，可能过拟合了。也就是说：不断添加变量能让模型的效果提升，而这种提升可能是虚假的。因此引入调整的R方

Adjusted R^2 :对于无意义的变量添加惩罚，因此如果你增加无意义的特征变量，Adjusted R^2 会降低；当添加有用的特征的时候才会增加。

$R_{a d j}^{2}=1-\left[\frac{\left(1-R^{2}\right)(n-1)}{n-k-1}\right]$

n是样本的数量，k是变量（特征，不包括常量）

参考资料：《Getting Started with Machine Learning》-Jim Liang

金融科技自习生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于模型评估的一些简单回顾

泛化性能：泛化能力用来评价一个训练好的模型在未知数据上的表现好坏。欠拟合与过拟合：欠拟合：指的是模型训练不够，没有捕获到数据中有用的特征或者模式。（低偏差）过拟合：模型过度训练，在训练数据上表现很好，在测试集上表现不佳。（高方差）看下图：左边：训练误差和测试误差都很高，代表欠拟合，偏差大。右边：训练误差很低，但是测试误差很高，代表过拟合，方差大。模型验证策略：...
复制链接

扫一扫

专栏目录

金融科技自习生 CSDN认证博客专家 CSDN认证企业博客

码龄6年

53: 原创

5万+: 周排名

79万+: 总排名

14万+: 访问

: 等级

1948: 积分

70: 粉丝

114: 获赞

35: 评论

555: 收藏

私信

关注

热门文章

分类专栏

最新评论

【精简推导】线性回归、岭回归、Lasso回归（最小二乘法）
xubin17854112852: Lasso不是从根本上解决多重共线性问题，而是限制多重共线性带来的影响。后面这句话怎么理解？
深度之眼【Pytorch】-读取自己的数据 Dataset 和 ImageFolder
-Liy: 可以用 transforms.Grayscale()
一行命令取消Mac命令行默认使用conda
陈嘿萌: 有用！设置base为默认终端的窗口，感谢。conda config --set auto_activate_base true
深度之眼【Pytorch】-读取自己的数据 Dataset 和 ImageFolder
lmw0320: 我有个疑问，对于pytorch自带的ImageFolder方法，其输入的是数据集的文件夹路径，其貌似原本就是将数据用PIL.Image进行读取的，然后传入transform处理，转成tensor。如果说我设置transform是None，那其获取到的dataset应该是tensor格式，还是PIL.Image的图片格式？我测试过，貌似是图片格式的，那要如何进行参数设置，确保其不传入transform的情况下，转成的是tensor格式呢？ ---我主要是想事先获取到训练数据集的均值和标准差，方便实际加载数据集的transforms的标准化操作。
scikit-learn机器学习--随机森林
lhvhkih: 交叉验证得到最佳的值怎么用到随机森林模型中去

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。