机器学习(周志华) 习题参考答案第十三章

最新推荐文章于 2023-11-02 20:51:15 发布

nilgnaw

最新推荐文章于 2023-11-02 20:51:15 发布

阅读量2.9k

点赞数 4

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nilgnaw/article/details/108655456

版权

周志华老师的《机器学习》的第13章的习题答案较少，只找到了三篇，分别为链接一和链接二，这两篇文章有几乎所有题目的个人解答。第三个人只对部分题目进行了解答，相关链接将放在题目下方。
以下是个人对这章的习题的理解，如有问题，欢迎指正。其中第四题和第五题网上答案较多，不再重复。

13.1推导式(13.5)~(13.8)。

见链接三这个答案解答的已经非常好了。

13.2朴素贝叶斯，生成式半监督算法。

链接三
上述链接中的答案，在前面分析的都没有疑问，但是最后求解时，感觉没有体现EM算法的M步，只是迭代求解，没有最大化过程。有点像题13.8中的自训练算法。
我个人的答案为：
在这里插入图片描述

13.3混合专家，生成式半监督算法。

链接三答案写的非常好，非常详细，还分两种情况进行了讨论。

13.6TSVM改进算法。

有两个想法：
一是将图13.6中第6行的任意ξ_i和ξ_j，改为两个类别中值最大的ξ；二是每次迭代取满足要求的几个ξ对，在迭代过程中逐渐减少使用的对数。

13.7新样本分类的图半监督学习方法。

如13.4节最后一段所说，使用额外的预测机制，如SVM，LR等，或者根据属性值考虑使用KNN。

13.8自训练(self-training)的缺陷。

若有错误标记，则误差可能会在传播过程中扩大，使训练集中的错误样本较多，即噪声较多，降低预测的正确率，见《基于半监督学习的朴素贝叶斯分类新算法》中有描述。

13.9将两个视图分离出来。

书中P305说两个视图要充分且条件独立。所以可以考虑从条件独立入手，分离两类属性。
假定数据集中包括完整的属性值和标记值。
首先计算每个属性的条件分布，然后计算每对属性的概率分布的相关系数，根据相关系数将几乎相互独立的属性分到不同的视图中。

13.10违约检测。

链接三给出了一种较为复杂的算法，但是我对他的答案中使用距离判断违约的观点不太认同，所以我还是从集合的角度处理违约，具体如下。
首先处理集合M，将M中有传递性的样本对放入一个集合中。
然后根据流程图实现算法。
在这里插入图片描述

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。