机器学习笔记 - 性能度量

最新推荐文章于 2024-08-26 06:45:00 发布

volvet

最新推荐文章于 2024-08-26 06:45:00 发布

阅读量533

点赞数 1

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/volvet/article/details/54896830

版权

机器学习专栏收录该内容

29 篇文章 1 订阅

订阅专栏

在预测任务中, 给定样本集 $D = \{ (x_1, y_1), (x_2, y_2), ... , (x_m, y_m)\}$ , 其中 $y_i$ 是样本 $x_i$ 的真实标记, 要评估学习器的性能, 就要把学习预测结果 $f(x)$ 跟真实的标记进行比较。
回归任务常用均方误差(mean squared error)

E (f; D) = 1 m \sum i = 1 m (f (x i) - y i) 2

$E(f;D) = \frac {1}{m} \sum_{i=1}^m(f(x_i)-y_i)^2$
更一般的，对于数据分布

D $D$ 和其概率密度函数

p(.) $p(.)$ , 均方误差可描述为

E (f : D) = \int x \subset D (f (x) - y) 2 p (x) d x

$E(f:D) = \int_{x\subset D}(f(x)-y)^2p(x)dx$

错误率与精度

给定样本集 $D$ , 分类错误率定义为

E (f; D) = 1 m \sum i = 1 m (f (x i) \neq y i)

$E(f;D) = \frac{1}{m} \sum_{i=1}^m(f(x_i) \neq y_i)$
精度定义为

a c c (f; D) = 1 m \sum i = 1 m (f (x i) = = y i)

$acc(f;D) = \frac{1}{m} \sum_{i=1}^m(f(x_i) == y_i)$
更一般的，对于数据分布

D $D$ 和其概率密度函数

p(.) $p(.)$ , 错误率和精度定义为

E (f; D) = \int x \subset D (f (x) \neq y) p (x) d x

$E(f;D)=\int_{x\subset D}(f(x)\neq y)p(x)dx$

a c c (f; D) = \int x \subset D (f (x) = = y) p (x) d x = 1 - E (f; D)

$acc(f;D)=\int_{x\subset D}(f(x)==y)p(x)dx = 1 - E(f;D)$

混淆矩阵(Confusion Matrix)

对于二分类问题，可以将其真实类别和预测类别的组合划分为TP(true positive), FP(false positive), TN(true negative), FN(false negative)四种，显然 TP + FP + TN + FN = 样本总数。
分类结果的混淆矩阵如下所示

真实情况	预测结果
正例	正例(TP)
正例	反例(TN)
反例	正例(FP)
反例	反例(FN)

查准率 $P$ 与查全率 $R$

P = T P T P + F P

$P = \frac{TP}{TP + FP}$

R = T P T P + T F

$R = \frac{TP}{TP + TF}$

　P-R曲线, ROC 与 AUC

P-R 曲线是以Ｐ为纵轴，　Ｒ为横轴作图得到的曲线．
平衡点(Break-Even Point) 是 P == R 时候的取值.
True Positive Rate(TPR)
False Positive Rate(FPR)

T P R = T P T P + F N

$TPR = \frac{TP}{TP+FN}$

F P R = F P T N + F P

$FPR = \frac{FP}{TN+FP}$
ROC曲线就是以TPR为纵轴，　FPR为横轴的曲线
AUC(Area Under ROC Curve)

Reference

机器学习 - 周志华清华大学出版社

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

volvet CSDN认证博客专家 CSDN认证企业博客

码龄16年

83: 原创

17万+: 周排名

100万+: 总排名

30万+: 访问

: 等级

4119: 积分

129: 粉丝

213: 获赞

59: 评论

112: 收藏

私信

关注

热门文章

分类专栏

多媒体 68篇
Linux 3篇
Mobile 40篇
机器学习 29篇
服务器 4篇
编译系统
数学 2篇
opengl 1篇
计算机网络 1篇
pthon 1篇

最新评论

实时抠图算法
ccphzf: 博主，这个传入原图就可以抠图了吗？
WebRTC 中的Quality Scaler
StoneLiu999: 这里的丢帧并不是编码器失败丢帧，是在编码前就丢帧了，为了控制输出码率不大于设置码率而丢的帧
略谈OpenGL中的共享上下文(EGL Context)
liuyunProgramer: 请教一下，多线程中可以共享VBO吗？
PCA在图像处理上的应用
YYogurt: 博主，你好，请问能分享下这个博文的源代码吗？方便的话麻烦您发送到1192128469@qq.com
WebRTC中的拥塞控制一
VABIS_VHAS: 非常有帮助，如有有时间可以访问我的主页，欢迎互关。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。