机器学习中评价方法

最新推荐文章于 2023-10-30 14:19:38 发布

Matrix-yang

最新推荐文章于 2023-10-30 14:19:38 发布

阅读量860

点赞数 1

分类专栏：机器学习基础入门

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_21768483/article/details/89153200

版权

基础入门同时被 2 个专栏收录

47 篇文章 2 订阅

订阅专栏

42 篇文章 12 订阅

订阅专栏

经验误差和泛化误差

经验误差=训练误差
泛化误差=正式使用的误差 $\approx$ 测试误差
过拟合：经验误差小，泛化误差大
欠拟合：经验误差大

错误率和精度

精度：
$acc=\frac1m\sum_{i=1}^m\mathbb{I}(f(x_i)=y_i))$
错误率=1-精度

查准率，查全率，F1

真实\预测	正	负
真	TP	FN
假	FP	TN

查准率(precision)：
$P=\frac{TP}{TP+FP}$
查全率（召回率 Rcall）：
$R=\frac{TP}{TP+FN}$
PR曲线

将所有样本按照是正例的可能性排序（降序），从左到右依次计算当前的查准率和查全率。
特性：A曲线包住C，则A学习器更优。如有交叉则不能确定
F1
$\frac{1}{F1}=\frac{1}{2}(\frac{1}{P}+\frac{1}{R})$
可推导出：
$F1=\frac{2PR}{P+R}=\frac{2TP}{2TP+FP+FN}$

ROC与AUC

ROC(受试者工作特征 Receiver Operating Characteristic)

真正例率(多少真被预测成正)
$TPR=\frac{TP}{TP+FN}$
假正例率(多少假被预测成正)
$FPR=\frac{FP}{FP+TN}$
ROC
把学习器对样例的预测结果排序（降序），按此顺序把样本当做正例开始预测。

如上，是三条ROC曲线，在0.23处取一条直线。那么，在同样的FPR=0.23的情况下，红色分类器得到更高的TPR。也就表明，ROC越往上，分类器效果越好。
AUC
AUC是ROC的下包面积，面积越大学习器越好。

偏差，方差

偏差
度量了学习算法的期望预测与真实结果的偏离程度，即刻画了学习器本身的拟合能力
方差
度量了同样本大小的训练集的变动所导致学习器性能变化，方差小，性能稳定，学习器好

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习中评价方法

经验误差和泛化误差经验误差=训练误差泛化误差=正式使用的误差 ≈\approx≈测试误差过拟合：经验误差小，泛化误差大欠拟合：经验误差大错误率和精度精度：acc=1m∑i=1mI(f(xi)=yi))acc=\frac1m\sum_{i=1}^m\mathbb{I}(f(x_i)=y_i))acc=m1i=1∑mI(f(xi)=yi))错误率=1-精度查准率，查全率，...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。