模型评估与选择

评估方法

数据足够时,用留出法和交叉验证
数据量少时,用自助法

性能度量

错误率和精度

都是针对全部样本而言。

注意区分精度和精确率!

错误率:分类错误的样本占样本总数的比例
精度(准确率):分类正确的样本占样本总数的比例

关系:和为1

查准率、查全率、F1

混淆矩阵

真实情况 预测结果
正例反例
正例TPFN
反例FPTN

注:无论TF还是PN都是根据预测结果而言的。预测为正负有PN,预测对错有TF。

查准率(精确率) :预测为正例的里面有多少是真的正例。精确率是针对预测结果而言的。
P = T P T P + F P P=\frac{TP}{TP+FP} P=TP+FPTP
查全率 (召回率):真实为正的里面有多少是预测对了。召回率是针对原来的样本而言的。
R = T P T P + F N R=\frac{TP}{TP+FN} R=TP+FNTP

关系:分母不同,一个是真实为正,一个是预测为正。
负相关。因为如果需要准确率高,就只挑正的可能性大的样本,注定挑出的正样本数不会很多。如果要召回率高,就尽量挑出所有样本,这样就会包括了所有正样本

根据上述关系,可以得"P-R"曲线

平衡点:与 y = x y = x y=x 的交点。

f 1 = 2 × P × R P + R f_1 =\frac{2 \times P \times R}{P + R} f1=P+R2×P×R
是调和平均

补充:关于多元的weightRecall、weightPrecision,f1
都乘以每一类的权重,即把某类当成正类时,乘以该类权重。

P = T P T P + F P × T P + F N T P + F P + T N + F P + T N T N + F N × F P + T N T P + F P + T N + F P P=\frac{TP}{TP+FP} \times \frac{TP+FN}{TP+FP+TN+FP} +\frac{TN}{TN+FN} \times \frac{FP+TN}{TP+FP+TN+FP} P=TP+FPTP×TP+FP+TN+FPTP+FN+TN+FNTN×TP+FP+TN+FPFP+TN

R = T P T P + F N × T P + F N T P + F P + T N + F P + T N T N + F P × F P + T N T P + F P + T N + F P R=\frac{TP}{TP+FN} \times \frac{TP+FN}{TP+FP+TN+FP} +\frac{TN}{TN+FP} \times \frac{FP+TN}{TP+FP+TN+FP} R=TP+FNTP×TP+FP+TN+FPTP+FN+TN+FPTN×TP+FP+TN+FPFP+TN

f 1 = f 1 11 × T P + F N T P + F P + T N + F P + f 1 00 × F P + T N T P + F P + T N + F P f_1=f^{11}_1 \times \frac{TP+FN}{TP+FP+TN+FP} +f^{00}_1 \times \frac{FP+TN}{TP+FP+TN+FP} f1=f111×TP+FP+TN+FPTP+FN+f100×TP+FP+TN+FPFP+TN

ROC、AUC

真正例率:真正例中预测正例的比例
T P R = T P T P + F N TPR=\frac{TP}{TP+FN} TPR=TP+FNTP
假正例率:真反例中预测正例的比例
F P R = F P T N + F P FPR=\frac{FP}{TN+FP} FPR=TN+FPFP

总结对比:
1.P-R曲线和ROC曲线的坐标轴都有一项是真正占实正的比例,另一项一个是真正/预正,一个是假正/实负。
2.P-R负相关,ROC正相关

有限样本计算横纵坐标只能得到折线

代价敏感错误率、代价函数

FP.TN的代价取不同

比较检验

通过假设检验(二项检验、t检验)、交叉验证t检验、McNemar检验、Friedman检验、Nemenyi检验等来比较学习器性能

偏差、方差

偏差-方差窘境

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值