分类问题的SVM、随机森林、决策树

最新推荐文章于 2024-09-28 19:42:39 发布

MSE-STAR-CVHERO

最新推荐文章于 2024-09-28 19:42:39 发布

阅读量1.3k

点赞数 2

文章标签：决策树支持向量机机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dd_wl1/article/details/122014121

版权

分类问题

什么是支持向量机

分类梨和苹果除了用KNN画个圈还有什么好办法？

画条线！
- 通过两者所在的空间做出区分当新样本落在苹果一侧就是苹果，反之就是梨。而这条线就是SVM支持向量机。
- 除了界限，样本与线的距离同样有意义代表着样本分类的可信程度，以苹果一侧为例与线距离最远的样本是苹果的可能性最高离的越近是苹果的可能性就越低。
- 目标是在两种样本之间找到能让所有样本的分类可信程度最高的那条线。不必计算所有的距离，只要找到线附近的样本让它们与线的距离越远越好，这个距离被称为分类间隔****，决定了线的样本被称为支持向量**。
- 如果样本的分布有***交叉***，就关注这些无法被线正确分类的样本与线之间的距离，找到能***最小化这个距离的线***。
- 如果样本的分布并不理想，无法用直线区分怎么办？
  
  ：通过一定的变换，将它们映射到一个能用直线区分的空间，再寻找分类线。
在深度学习出现之前，随机森林和SVM是最好用的分类方法，SVM对样本依赖小，不会过拟合，小样本也能取得不错的效果。

什么是随机森林

随机森林里有很多决策树，随机森林是决策树的升级版，随机指的是树的生长过程，随机森林中的树各不相同。在构建决策树时，从训练数据中有放回的随机选取一部分样本，同样，我们也不会使用数据的全部特征，而是随机选取部分特征进行训练，每棵树使用的样本和特征各不相同，训练结果自然不同。

为什么要随机样本和特征

:训练最初我们并不知道哪些是异常样本，也不知道哪些特征对分类结果影响更大，随机过程降低了两者对分类结果的影响。随机森林的输出结果由投票决定，如果大部分决策树认为测试数据是好苹果，那么就认为它是一个好结果。树与树之间的独立，它们可以同时训练，随机的过程让它不容易过拟合，能够处理特征较多的高维数据也不需要做特征选择。合理训练后准确性很高，不知道使用什么分类方法时，先试试随机森林。

在机器学习中，随机森林属于集成学习，也就是将多个模型组合起来解决问题，这些模型会独立学习、预测和投票出结果，准确度往往比单个的模型高很多，除了决策树，还可以使用神经网络等其他模型。集成学习内部不必是同样的模型，神经网络和决策树可以共存于同一个系统中。

决策树

在冒险过程中遭遇敌人是攻击还是逃跑，为达到目标根据一定的条件进行选择的过程就是决策树。决策树模型由节点和边构成。节点会根据样本的特征作出判断，最初的节点被成为根节点，其余的被称为子节点，不再有分支的节点则被称为叶子节点，代表样本的分类结果，边则指示着方向，特征这么多谁来做根节点，接下来的节点又该是什么？

为了构造决策树，人们找到了一个衡量标准：熵：代表热力学中系统的混乱程度和决策树分支下样本种类的丰富性。样本种类越多越混乱，熵就越大，如果分支下的样本完全属于同一类，熵就等于0。构造树的基本思路就是随着层数的增加让熵快速降低，熵降低的速度越快，代表决策树的分类效率越高。决策树最大的优点是天然的可解释性，例如：苹果之所以是好苹果，是因为它又大又脆又甜。缺点也很明显：数据都是有特例的，如果一颗树能将样本完美分类，那它一定是过拟合的。

解决的方法很简单，去掉一些分支：剪枝。

预剪枝：在训练开始前规定条件，比如树达到某一深度就停止训练，后剪枝则是先找到树再根据一定条件如限制叶子结点的个数去掉一部分的分支。

MSE-STAR-CVHERO

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

MSE-STAR-CVHERO CSDN认证博客专家 CSDN认证企业博客

码龄4年

64: 原创

59万+: 周排名

223万+: 总排名

3万+: 访问

: 等级

777: 积分

46: 粉丝

73: 获赞

5: 评论

119: 收藏

私信

关注

热门文章

分类专栏

linux运维 8篇
CICD开发 1篇
.net学习 25篇
命名规则 1篇
垂直同步 1篇
游戏 1篇

最新评论

基于containerd容器运行时,kubeadmin部署k8s 1.28集群
MSE-STAR-CVHERO: docker源? 目前k8s的默认容器支持就是containerd,所以这篇文章讲的就是基于containerd的k8s.而替换runc的原因是containerd自带的runc可能存在问题
基于containerd容器运行时,kubeadmin部署k8s 1.28集群
安的木偶游戏: 博主你好，为什么要这样安装container，使用docker源直接yum安装一个是不是一样的。请问替换runc的原因是与你container的版本需要一直吗？这个不是很了解冒昧提问。谢谢！
基于containerd容器运行时,kubeadmin部署k8s 1.28集群
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/617643206。
C++中static的作用
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题“C++中static的作用”听起来非常有趣。通过解析static在C++中的用法，您帮助读者更好地理解了这个关键的概念。我很高兴看到您持续创作并分享您的知识。对于下一步的创作建议，我谨慎地提出一个想法。或许您可以考虑探讨一下在不同编程语言中static的用法和差异。这样的话，读者可以更好地了解static在不同语境下的作用和含义。当然，这只是一个建议，您可以自由选择感兴趣的主题。期待您未来更多的博客，继续保持创作！谢谢您与我们分享您的知识和见解。
esp32入门指南
m0_68720159: 编译出错怎么搞

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。