周志华机器学习作业练习第2章模型评估与选择

最新推荐文章于 2022-05-05 16:59:30 发布

每天吃一个苹果

最新推荐文章于 2022-05-05 16:59:30 发布

阅读量477

点赞数 2

分类专栏：西瓜书

本文链接：https://blog.csdn.net/weixin_41992565/article/details/91362995

版权

西瓜书专栏收录该内容

4 篇文章 0 订阅

订阅专栏

在这里插入图片描述
从正例中取150+从反例中取150 ： $C_{500}^{150})^2$

在这里插入图片描述
10折交叉检验：假设样本分布均匀(每次训练样本中正反例数目一样)，所以错误率的期望是50%。
留一法：特殊的交叉验证方法(样本数为m，进行m折交叉验证)错误率为100%

在这里插入图片描述
1.BEP 是根据不同分类阀值找到查准率=查全率时的取值
2.而F1是根据不同分类阀值选取的最大F值

3.所以我们不应该把F1中的p和r带入BEP中互相转换，因为他们很可能取的阀值是不同的。
4.对于题目我们可以举一个反例，假设两条P-R曲线在查准率和查全率相等时相交(他们的BEP相等)，且两个曲线不相等，会出现F值不同。所以F值高BEP不见得高。

在这里插入图片描述
查全率: 真实正例被预测为正例的比例
真正例率: 真实正例被预测为正例的比例
显然查全率与真正例率是相等的。

查准率:预测为正例的实例中真实正例的比例
假正例率: 真实反例被预测为正例的比例
两者并没有直接的数值关系。

2.5 试证明(2.22) $AUC=1−l_{rank}$

2.21
2.21这个公式还是挺难看懂的，大概意思是 $f(x^+)<f(x^-) 记1分，f(x^+)=f(x^-) 记0.5分，之后累加。在乘\frac{1}{m^+m^-}$
在这里插入图片描述
结合ROC曲线的原理，让罚值从高到低变换得到对应的真正率和假正率。

根据AUC公式展开， $\frac{1}{2}\sum_{i=1}^{m-1}(\frac{TP_{i+1}}{TP_{i+1}+FN_{i+1}}+\frac{TP_{i}}{TP_{i}+FN_{i}})*(\frac{FP_{i+1}}{FP_{i+1}+TN_{i+1}}-\frac{FP_{i}}{FP_{i}+TN_{i}})$