02 机器学习中的评估指标

机器学习中的评估指标

1. 机器学习的目标

  • 根本目标:

    在给定的训练数据上,试图训练出能够归纳数据的规律的模型,并且能在未知样本上也有好的效果。

  • 泛化能力强的模型最好

    能很好地适用于未知样本,如错误率低,精度高

2. 评估方法

使用测试集数据进行可靠的评估

测试集:测试集(用于评估)应该与训练集(用于模型学习)“互斥

常见方法:

  • 留出法 hold-out
    • 保持数据分布一致(如:分层采样)
    • 多次重复划分(如:100次随机划分)
    • 数量适中,20-30%

这里写图片描述

  • 交叉验证法 cross-validation
    • k折交叉验证
    • 若k = m,则得到留一法(leave-one-out,LOO)

这里写图片描述

  • 自助法 bootstrap

    • 基于“自助采样”的方法(bootstrap smapling)
    • 别称:“有放回采样”,“可重复采样
    • 约有36.8%的样本不出现
      • 训练集与原样本集同规模,且数据分布有所改变(可能会重复出现)
      • 测试集:训练集中未出现的原样本

limm+(11m)m=0.368(13) (13) lim m → + ∞ ( 1 − 1 m ) m = 0.368

3. 评估度量标准

性能度量 performance measure

  • 衡量模型泛化能力的数值评价标准,反应了当前问题(任务需求)
  • 使用不同的性能度量可能会导致不同的评判结果

    模型的“好坏”,不仅取决于算法和数据,还取决于**当前任务需求**
    

常用性能度量:

- 分类问题

1. 错误率

E(f;D)=1mi=1mI(f(x)yi)(14) (14) E ( f ; D ) = 1 m ∑ i = 1 m I ( f ( x ) ≠ y i )

2. 精度

acc(f;D)=1mi=1mI(f(x)=yi)=1E(f;D)(15) (15) a c c ( f ; D ) = 1 m ∑ i = 1 m I ( f ( x ) = y i ) = 1 − E ( f ; D )

指示函数,当括号内的条件成立时取 1 ,不成立时取 0

二分类混淆矩阵

真实情况预测情况
正例反例
正例TP(真正例)FN(假反例)
反例FP(假正例)TN(真反例)

3.查准率(准确率):预测出的正例中真实的正例所占比例

P=TPTP+FP(16) (16) P = T P T P + F P

4.查全率(召回率):真实的正例中预测正确的比例

R=TPTP+FN(17) (17) R = T P T P + F N

5.F1值

F1=2×P×RP+R=2×TPm+TPTN(18) (18) F 1 = 2 × P × R P + R = 2 × T P m + T P − T N

Fβ=(1+β2×P×R)(β2×P)+R(19) (19) F β = ( 1 + β 2 × P × R ) ( β 2 × P ) + R

通过设置权重 \beta ,调整查准率与查全率的重要度
\beta > 1 时,查全率有更大影响;
\beta < 1 时,查准率有更大影响;

6.ROC && AUC

ROC:Receiver Operating Characteristic Cruve
AUC:Area Under thd ROC Cruve,即曲线下方的面积

image

AUC=11m+mx+DxD(I(f(x+)<f(x))+12I(f(x+)=f(x)))(20) (20) A U C = 1 − 1 m + m − ∑ x + ∈ D ∑ x − ∈ D ( I ( f ( x + ) < f ( x − ) ) + 1 2 I ( f ( x + ) = f ( x − ) ) )

AUC值范围 0~1,值越大,结果越好

- 回归问题

1.平均绝对误差:MAE(Mean Absolute Error)

MAE=1ni=1nfiyi(57) (57) M A E = 1 n ∑ i = 1 n ∣ f i − y i ∣

2.均方误差:MSE(Mean Square Error)

MAE=1ni=1n(fiyi)2(58) (58) M A E = 1 n ∑ i = 1 n ( f i − y i ) 2

3.均方根误差:RMSE(Root Mean Square Error)

RMSE=MSE(59) (59) R M S E = M S E

4.R平方

r2=1SSresSStot=1(yifi)2(yiymean)2(60) (60) r 2 = 1 − S S r e s S S t o t = 1 − ∑ ( y i − f i ) 2 ∑ ( y i − y m e a n ) 2

其它详细内容:https://blog.csdn.net/batuwuhanpei/article/details/51884351

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值