文章标题

最新推荐文章于 2022-01-26 00:15:00 发布

sinat_37542106

最新推荐文章于 2022-01-26 00:15:00 发布

阅读量1.1k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/sinat_37542106/article/details/78197824

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1.代价敏感错误率与代价函数

真实情况	预测正例	预测反例
正例	0	$cost_{01}$
反例	$cost_{10}$	0

“代价敏感”错误率为

E (f; D; c o s t) = 1 m (\sum x i \in D + I I (f (x i \neq y i)) \times c o s t 01 + \sum x i \in D - I I (f (x i) \neq y i) \times c o s t 10)

$E(f;D;cost)=\frac{1}{m}(\sum_{x_i\in D^+}II(f(x_i \neq y_i ))\times cost_{01}+\sum_{x_i\in D^-}II(f(x_i)\neq y_i)\times cost_{10})$
在非均衡代价下，ROC曲线不能满足学习器的期望总体代价，而“代价曲线”则可达到该目的。横轴为正例概率代价：

P (+) c o s t = p \times c o s t 01 p \times c o s t 01 + ( 1 - p ) \times c o s t 10,

$P(+)cost=\frac{p\times cost_{01}}{p\times cost_{01}+(1-p)\times cost_{10}},$
纵轴为归一化代价：

c o s t n o r m = F N R \times p \times c o s t 01 + F P R \times ( 1 - p ) \times c o s t 10 p \times c o s t 01 + ( 1 - p ) \times c o s t 10

$cost_{norm}=\frac{FNR\times p \times cost_{01}+FPR \times (1-p) \times cost_{10}}{p \times cost_{01}+(1-p) \times cost_{10}}$
FNR为假阴性率，FPR为假阳性率。
代价函数

2.比较检验

2.1 假设检验

假设检验中的“假设”是对于学习器泛化错误率分布的某种判断或者猜想。现实中我们并不知道泛化错误率，只能获知其测试错误率 $\check \epsilon$ .泛化错误率与测试错误率未必相同。但可根据测试错误率估推出泛化错误率的分布。
对于泛化错误率为 $\epsilon$ 的学习器;假设有m个测试样本，测试错误率 $\check \epsilon$ 意味着在m个测试样本中恰有 $\check \epsilon \times m$ 个被误分类。则得到错误率为 $\check \epsilon$ 的概率为

P (ϵ ˇ; ϵ) = (m ϵ ˇ \times m) ϵ ϵ ˇ \times m (1 - ϵ) m - ϵ ˇ \times m

$P(\check \epsilon;\epsilon)={m \choose \check \epsilon \times m}\epsilon^{\check \epsilon \times m}(1-\epsilon)^{m-\check \epsilon \times m}$

ϵˇ=ϵ $\check \epsilon=\epsilon$ 时P最大，且这符合二项分布
这里写图片描述

我们根据图表粗略估计ε0，比如这幅图当中ε0可取5,6,7都可以，然后求出总体概率α，我们把大多数样本分布的区间1-α称为置信区间，所以只要不超过ε0，即在置信度下就是符合条件的假设，否则被抛弃，即在α显著度下。
这里写图片描述

包含m个样本的测试集上，泛化错误率为的学习器被测得测试错误率为的概率：
很多时候我们并非仅做一次留出估计，而是通过多次留出法或是交叉验证法，得到k个测试错误率

ϵˇ1 $\check \epsilon_1$ 、

ϵˇ2 $\check \epsilon_2$ 、…..、

ϵˇk $\check \epsilon_k$ ,此时可以使用“t-检验”。
平均错误率

μ $\mu$ 和方差

σ2 $\sigma_2$ 为

μ = 1 k \sum i = 1 k ϵ ˇ i

$\mu=\frac{1}{k}\sum_{i=1}^k\ \check \epsilon_i$

σ 2 = 1 k - 1 \sum i = 1 k (ϵ ˇ i - μ) 2

$\sigma^2=\frac{1}{k-1}\sum_{i=1}^{k}(\check \epsilon_i-\mu)^2$
考虑到这k个测试错误率可看成泛化错误率

ϵ0 $\epsilon_0$ 的独立采样，则变量

τ t = k \sqrt ( μ - ϵ 0 ) σ

$\tau_t=\frac{\sqrt{k}(\mu-\epsilon_0)}{\sigma}$
服从自由度为k-1的t分布。
对假设“

μ=ϵ0 $\mu=\epsilon_0$ ”和显著性

α $\alpha$ 我们可计算出错误率均值为

ϵ0 $\epsilon_0$ 的

1−α $1-\alpha$ 概率内能观察到的最大错误率，即临界值。双边t验证的常见临界值。
这里写图片描述

2.2交叉验证t检验

对于学习器A、B，若我们使用k折交叉验证法得到各种的k组测试错误率。若两个学习器的性能相同，则他们使用相同的训练/测试集得到的测试错误率应相同,即 $\epsilon_i^A$ = $\epsilon_i^B$
对每对结果求查 $\delta_i=\epsilon_i^A-\epsilon_i^B$ ;若两个学习器的性能相同，则差值均值应为零。此时再应用前面相同的分析，两个学习器显著度分析结果。

2.3 McNemar 检验

对于二分类问题学习器A和B:
这里写图片描述
如果假设两学习器性能相同，则应该有 $e_{01}=e_{10}$ ,那么变量 $|e_{01}-e_{10}|$ 应当服从正态分布。McNemar考虑变量：

τ χ 2 = ( | e 01 - e 10 | - 1 ) 2 e 01 + e 10

$\tau_{\chi^2}=\frac{(|e_{01}-e_{10}|-1)^2}{e_{01}+e_{10}}$
服从自由度为1的

χ2 $\chi^2$ 分布，给定显著度

α $\alpha$ ,即可用分析两个学习器的性能差别。

2.4 Friedman检验与 Nemenyi后续检验

Friedman检验
多个数据集每个数据集对多个算法A、B、C、D的性能排序，求得服从自由度为k-1的 $\chi^2$ 分布的变量：
$τ F = ( N - 1 ) τ χ 2 N ( k - 1 ) - τ χ 2$ $\tau_F=\frac{(N-1)\tau_{\chi^2}}{N(k-1)-\tau_{\chi^2}}$
检测是否所有算法的性能相同
2.Nemenyi后续检验
若算法的性能是不一样的，则需要进行后续检验来进一步区分各算法。常见的为Nemenyi后续检验。
Nemenyi检验计算平均序列值差别的临界值域：
$C D = q α k ( k + 1 ) 6 N - - - - - - - \sqrt$ $CD=q_\alpha\sqrt{\frac{k(k+1)}{6N}}$

2.5 偏差和方差

“偏差和方差分解”是分析学习器泛化能力的一种重要工具。
学习器的期望预测为：

f (x) ¯ ¯ ¯ ¯ ¯ ¯ ¯ = E D [f (x; D)]

$\overline{f(x)}=E_D[f(x;D)]$
不同训练集产生的方差为

v a r (x) = E D [(f (x; D) - f (x) ¯ ¯ ¯ ¯ ¯ ¯ ¯) 2]

$var(x)=E_D[(f(x;D)-\overline{f(x)})^2]$
偏差为

b i a s (x) 2 = (f (x) ¯ ¯ ¯ ¯ ¯ ¯ ¯ - y) 2

$bias(x)^2=(\overline{f(x)}-y)^2$
于是泛化误差为

E (f; D) = v a r (x) + b i a s (x) 2 + ϵ 2

$E(f;D)=var(x)+bias(x)^2+\epsilon^2$
偏差、方差、噪声的含义为：偏差表示学习器的期望预测与实际之间的偏离程度，表征学习器对数据的拟合能力；方差表示同样大小的训练集的变动导致学习性能的变化，即刻画了数据扰动所造成的影响；噪声表示当前任务下所能达到的期望泛化误差的下限。
偏差和方差是存在冲突的，在训练程度不足时，拟合程度不够，训练数据的扰动不大，偏差主导泛化错误率，称为欠拟合；训练加深后，拟合程度充足，但训练集的轻微扰动都会造成结果的显著波动，方差主导泛化错误率，称为过拟合。
这里写图片描述