西瓜书《机器学习》课后答案——chapter10 降维与度量学习

最新推荐文章于 2025-04-12 23:34:46 发布

Vic时代

最新推荐文章于 2025-04-12 23:34:46 发布

阅读量1w

点赞数 11

分类专栏：机器学习文章标签：机器学习周志华习题答案降维第十章

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/VictoriaW/article/details/78359362

版权

10.1 西瓜书《机器学习》课后答案——chapter10 _10.1 KNN算法

10.2 令err,err∗分别表示最近邻分类器与贝叶斯最优分类器的期望错误率，试证明：

e r r * \leq e r r \leq e r r * (2 - | Y | | Y | - 1 \times e r r *) . (1)

$err^*\leq err\leq err^*\left( 2-\frac{|{\cal Y}|}{|{\cal Y}|-1}\times err^*\right). \tag{1}$

解答：
不知道这里所谓的期望错误率是指什么。在原论文Nearest Neighbor Pattern Classification. 1967.中，定义的是NN条件风险 $r(x, x_n^{'})$ 与NN总体风险 $R$ ，以及贝叶斯条件风险 $r^*(x)$ 与贝叶斯总体风险 $R^*$ 。在书中定义的 $P(err)$ 其实是NN条件风险。事实上，条件风险和总体风险都满足(1)。

贝叶斯条件风险与贝叶斯风险：
假设已知条件分布 $P(C|X)$ 与损失函数 $L(i, j)$ ， $L(i,j)$ 表示把i类实例误分为j类的损失。定义实例x上的条件风险为

r (C = j | X = x) = \sum i P (i | x) L (i, j) . (2)

$r(C=j|X=x)=\sum_i P(i|x)L(i, j). \tag{2}$

这个式子可以这样理解：实例的类别并不是唯一确定的，而是在所有类别上有一个分布。如果把实例划分为类别j，那么损失为L(i,j)的期望损失。

贝叶斯决策规则会把实例x分类到条件风险最小的类别，对应的条件风险称为Bayes条件风险：

r * (x) = min j r (j | x) . (3)

$r^*(x)=\min_j{r(j|x)}. \tag{3}$

Bayes条件风险的期望称为Bayes风险：

R * = E [r * (x)], (4)

$R^*=E[r^*(x)], \tag{4}$

这是所有的分类器所能达到的最小风险。

如果损失函数为0-1损失函数，则

r (C = j | X = x) = \sum i P (i | x) L (i, j) = 1 - P (j | x) . (5)

$r(C=j|X=x)=\sum_i P(i|x)L(i, j)=1-P(j|x). \tag{5}$

r * (x) = min j r (j | x) = min j {1 - P (j | x)} = 1 - max j P (j | x) . (6)

$r^*(x)=\min_j{r(j|x)}=\min_j\{1-P(j|x)\}=1-\max_j P(j|x). \tag{6}$

NN条件风险与NN风险：
给定训练数据 $\{(x_1,\theta_1), (x_2, \theta_2), \dots, (x_n, \theta_n)\}$ 。对实例 $x$ ，可以得到训练集中距离 $x$ 最近的样本，记作 $x_n^{'}$ 。如果 $x$ 的真实类别是 $\theta$ ，则NN算法的损失为 $L(\theta, \theta_n^{'})$ ，下面我们会考虑0-1损失函数。
如果所有的训练样本对都是随机变量，可以定义NN条件风险为：

r (x, x' n) = E [L (θ, θ' n) |

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。