周志华西瓜书《机器学习》习题提示——第2章

人工干智能

已于 2023-07-24 16:00:58 修改

阅读量219

点赞数

分类专栏：周志华【西瓜书】辅导《机器学习》文章标签：机器学习人工智能

于 2023-07-21 17:33:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qiy_icbc/article/details/131856861

版权

周志华【西瓜书】辅导同时被 2 个专栏收录

143 篇文章 25 订阅

订阅专栏

《机器学习》

143 篇文章 5 订阅

订阅专栏

2.1：分层采样，
$\left[ \binom{500}{500\times 70\%} \right]^2$

2.2：注意需要分层采样。

(1)10折交叉验证法

这时 $D_1,D_2,\cdots,D_{10}$ 均含有5个正例和5个负例，即训练集中的正负例个数相同，此时算法模型为随机猜测，错误率为50%。

(2)留一法

当“留一”为正例时，则训练集中负例占多数，训练出的算法模型预测“留一”（测试集）为负例，错误率为100%，当“留一”为负例时，同样推导出错误率为 100%。平均下来，该算法的错误率为100%。

此题说明：同一数据集用不同的方法分拆出训练集和测试集时，同一算法可能会有不同的错误率。

2.3：在BEP处 $P = R$ ，又由调和平均得到BEP处 $F_1=P=R$

若 $F_1^A>F_1^B$ 则
$\begin{equation*} \begin{cases} P^A>P^B\\ R^A>R^B \end{cases} \end{equation*}$
即A的BEP点高于B的。

2.4：参见：2.3 恭喜：高考你被录取了！式(3)

2.5*：参见2.4 事情有点麻烦：你的分数与别人并列了！

2.6：参见2.5 代价的曲线美中图1、图2的讨论。

2.7：2.5 代价的曲线美中，我们讨论了任意一条ROC曲线都有一条对应的代价曲线。

反过来，由于代价曲线是由“包络”形成的，即它的任一点Q都存在一条切线，该切线与正方形交于 $A (0, a)$ 与 $B (1, b)$ (【西瓜书图2.5】以及代价的曲线美中图1，
设 $\quad TPR=1-b$ ，则动点 $R (FPR, TPR)$ 在坐标系中形成ROC曲线。

2.8：
（1） $min - ma x$ 关注范围，将任意 $x_{min},x_{max}]$ 中的变量变换到指定的范围 $x'_{min},x'_{max}]$ 内，如，将120分制的分数转化为100分制的。而 $z - score$ 关注的是分布密度，将任意分布密度变量变换为标准正态分布。

（2） $min - ma x$ 公式只与端点值相关，而 $z - score$ 公式与全部值相关（需要计算 $\bar{x}$ 和 $\sigma _x$ ），即增加或减少样本时需要重新计算。

（3） $min - ma x$ 能将新变量固定到一个范围，如，归一化到[0,1]，而 $z - score$ 做不到，它能使得新变量服从标准正态分布 $N (0, 1)$ ，通过其累计分布可获得原变量各值所处的百分位位置，高考标准分及排位就是利用这个原理。

2.9： $\chi _2$ 检验过程同 $t$ 检验过程，只不过是查卡方分布表。

2.10：【西瓜书式(2.34)】用 $\chi _2$ 检验，【西瓜书式(2.35)】用 $F$ 检验，前者较后者保守。更多的知识可参考统计学的方差分析。

本文为原创，您可以：

点赞（支持博主）
收藏（待以后看）
转发（他考研或学习，正需要）
评论（或讨论）
引用（支持原创）
不侵权

上一篇：周志华西瓜书《机器学习》习题提示——第1章
下一篇：3.1 线性回归（线性模型对应于仿射函数）

人工干智能

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
周志华西瓜书《机器学习》习题提示——第2章

周志华西瓜书《机器学习》习题提示——第2章
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。