机器学习实战-模型评估

最新推荐文章于 2023-03-22 11:02:59 发布

googler_offer

最新推荐文章于 2023-03-22 11:02:59 发布

阅读量354

点赞数

分类专栏：机器学习机器学习实战

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/googler_offer/article/details/79039811

版权

机器学习机器学习实战专栏收录该内容

8 篇文章 1 订阅

订阅专栏

机器学习实战-模型评估

对于所学到的东西需要做一个评估。

错误率

错误率=a个样本分类错误/m个样本

精度=1-错误率

误差：学习器与实际预测输出与样本的真实值产生的差异

训练误差：即经验误差，学习器在训练集上的误差

泛化误差：学习器在新样本上的误差。

评估方法

留出法

D分为两个互斥的集合，一个作为S，一个作为T。

分层采样：S中正例和T中反例子一样。比如，D中有500正例子，500反例子。分层采样获得70%的样本有S，有350正例子，350反例子；其中30%的样本T，有150正例子，150反例子。

一般采用随机划分，重复进行实验评估后取平均值作为留出法的评估结果。

例如，进行100次随机划分，每次产生一个训练/测试集用于实验评估，100次后得到100个结果，而留出法返回的是100个结果的平均。

交叉验证法

也称作K折算法，D划分为k个大小相似的互斥子集。D通过分层采样得到每个子集Di，保持数据分布的一致性。每次用k-1个子集的并集作为训练集，余下那个作为测试集。既可以获得k组训练/测试集。进行k次训练和测试，最终返回k个测试结果的均值。

比如，第一次，1/10作为训练，9/10作为测试，然后2/10作为训练，8/10作为测试....

性能度量

均方误差。查准率，查全率，F1

PR曲线

二分类问题：true positive 真正例，False positive 假正例，True negative 真反例，False negative 假反例

查准率P = TP/(TP+FP)

查全率R = TP/(TP+FN)

通常来说，查准率高，查全率比较低；

学习器最可能是把正例的样本排在前面，按此排序，把样本作为正例进行预测。

如果一个学习器的PR曲线包住了另外一个，则可以认为A的性能要优于C。如果有交叉，则引入平衡点，基于BEP比较

A优于B

F1

F1=（2*P*R）/(P+R)=2*TP/样例总数+TP-TN

Fb = (1+b^2)*P*R/[(b^2*P)+R]

b>0度量了查全率对查准率的相对重要性，当b=1的时候退化为F1，,b>1的时候对查全率影响比较大，相反对查准率比较大。

F1是查全率与查准率的调和平均，Fb则是加权平均。

类似还有混淆矩阵等。

ROC，AUC曲线

ROC：纵轴：真正率TPR，横轴：假正率FPR

TPR=TP/(TP+FN),FPR=FP/(TN+FP)

若一个学习器的ROC曲线被另一个包住了，则后者的性能要强；若交叉则判断AUC面积。

检验

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习实战-模型评估

机器学习实战-模型评估对于所学到的东西需要做一个评估。错误率错误率=a个样本分类错误/m个样本精度=1-错误率误差：学习器与实际预测输出与样本的真实值产生的差异训练误差：即经验误差，学习器在训练集上的误差泛化误差：学习器在新样本上的误差。评估方法留出法D分为两个互斥的集合，一个作为S，一个作为T。分层采样：S中正例和T中反例子一样。比如，
复制链接

扫一扫

专栏目录

googler_offer CSDN认证博客专家 CSDN认证企业博客

码龄7年

183: 原创

4万+: 周排名

190万+: 总排名

47万+: 访问

: 等级

6265: 积分

88: 粉丝

184: 获赞

74: 评论

903: 收藏

私信

关注

热门文章

分类专栏

最新评论

Python: OSError: cannot load library libcairo.so.2
weixin_55048943: 啥意思，这代码怎么使用
try catch和if else语句的区别
一杯原谅绿茶: if是要么执行1，要么执行2。try是1执行不下去时继续执行2
Depthwise卷积与Pointwise卷积
s1mple、锵锵锵: 正常卷积过程比如5x5，3通道，n个卷积核分别对不同通道卷积，每个通道产生n张特征图，再去相同通道累加；depth-wise则是先去分通道卷积，再把每个通道内需要提取的特征写入3维卷积核1x1xm，每个通道产生m张特征图，再去累加，是这样吗？
try catch和if else语句的区别
天上有彬: 但执行返回结果可以使用try进行包着，当报错就返回空，这样做是否对程序有影响正确的做法是什么？
linux 安装matlab R2018a教程
已是一條廢魚: 萌新网现在关闭注册了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。