衡量监督算法的性能

分类算法

混淆矩阵

混淆矩阵通过比较分类结果与真实值,形象分类模型的准确度
在这里插入图片描述
在这里插入图片描述

准确率

反映了分类系统对整个样本的判定能力——能将正的判定为正,负的判定为负
A c c u r a c y = T P + T N T P + T N + F P + F N Accuracy = \frac{TP+TN}{TP+TN+FP+FN} Accuracy=TP+TN+FP+FNTP+TN
当数据集不平衡时,也就是正样本和负样本的数量存在显著差异时,单独依靠准确率不能评价模型的性能。精度和召回率是衡量不平衡数据集的更好指标。

回归算法

均方误差MSE(Mean Squared Error)

M S E = 1 m ∑ i = 1 m ( y ( i ) − y ^ ( i ) ) 2 MSE = \frac{1}{m}\sum\limits_{i=1}^m(y^{(i)}-\hat y^{(i)})^2 MSE=m1i=1m(y(i)y^(i))2
由于存在量纲问题,所以常常采用均方根误差

均方根误差RMSE(Root Mean Squared Error)

R M S E = 1 m ∑ i = 1 m ( y ( i ) − y ^ ( i ) ) 2 = M S E RMSE = \sqrt{\frac{1}{m}\sum\limits_{i=1}^m(y^{(i)}-\hat y^{(i)})^2}=\sqrt{MSE} RMSE=m1i=1m(y(i)y^(i))2 =MSE

平均绝对误差MAE(Mean Absolute Error)

M A E = 1 m ∑ i = 1 m ∣ y ( i ) − y ^ ( i ) ∣ MAE = \frac{1}{m}\sum\limits_{i=1}^m |y^{(i)}- \hat y^{(i)}| MAE=m1i=1my(i)y^(i)
为何loss function一把采用平方:

  1. 可导
  2. 放大较大误差

R Squared

为什么要采用R Squared:
因为已有的MSE,RMSE,MAE的问题在于,无法比较算法在不同场景下的优劣。比如同一个算法即可以预测学生的成绩也可以预测房产,那这个算法是在哪个场景下预测效果更好呢?

R 2 = 1 − S S r e s i d u a l S R^2 = 1-\frac{SS_{residual}}{S} R2=1SSSresidual
R 2 = 1 − ∑ ( y ^ − y ) 2 ∑ ( y ˉ − y ) 2 R^2 = 1 - \frac{\sum(\hat y - y )^2}{\sum (\bar y - y)^2} R2=1(yˉy)2(y^y)2
R 2 = 1 − M S E V a r R^2 = 1-\frac{MSE}{Var} R2=1VarMSE

在这里插入图片描述
反映出我们的模型没有产生错误的指标
把回归问题的衡量结果也归到0~1之间

R squared的性质:

  • 值小于等于1
  • 值越大越好
  • 当我们的模型等于基准模型时,值为0
  • 如果值<0,说明我们学习到的模型还不如基准模型,此时很有可能我们的数据不存在任何线性关系
  • 与准确度不同的是,值可以为负
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值