k-means、决策树、svm算法总结

我爱charming你

已于 2023-05-08 16:29:34 修改

阅读量1.8k

点赞数

文章标签：支持向量机算法决策树

于 2023-05-08 16:18:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42601270/article/details/130561102

版权

一、k-means算法

聚类算法：

一种典型的 无监督 学习算法，主要用于将相似的样本自动归到一个类别中。

在聚类算法中根据样本之间的相似性，将样本划分到不同的类别中，对于不同的相似度计算方法，会得到不同的聚类结果，常用的相似度计算方法有欧式距离法。

1.1聚类算法在现实中的作用

用户画像，广告推荐，Data Segmentation，搜索引擎的流量推荐，恶意流量识别

基于位置信息的商业推送，新闻聚类，筛选排序

图像分割，降维，识别；离群点检测；信用卡异常消费；发掘相同功能的基因片段

1.2 k-means聚类步骤

k-means其实包含两层内容：K表示初始中心点个数（计划聚类数），means求中心点到其他数据点距离的平均值。

具体步骤如下：

1.随机设置K个特征空间内的点作为初始的聚类中心。

2.对于其他每个点计算到K个中心的距离，未知的点选择最近的一个聚类中心点作为标记类别。

3.接着对着标记的聚类中心之后，重新计算出每个聚类的新中心点（平均值）。

4.如果计算得出的新中心点与原中心点一样（质心不再移动），那么结束，否则重新进行第二步过程。

K-means聚类实现流程：

事先 确定常数K ，常数K意味着最终的聚类类别数;

随机 选定初始点为质心 ，并通过计算每一个样本与质心之间的相似度(这里为欧式距离)，将样本点归到最相似的类中，

接着，重新计算 每个类的质心(即为类中心)，重复这样的过程，直到 质心不再改变，

最终就确定了每个样本所属的类别以及每个类的质心。

注意:由于每次都要计算所有的样本与每一个质心之间的相似度，故在大规模的数据集上，K-Means算法的收敛速度比较慢。

二、决策树算法

决策树是监督学习的分类算法, 训练决策树需要有标签的数据。

训练决策树模型需要考虑的问题:

1.特征选择:

选择哪个特征开始生长决策树，挑选分类能力强的特征

2.决策树的生长决策树的剪枝

三、SVM算法

找下图红色的线。

(36条消息) SVM算法详解_gua_niu123的博客-CSDN博客

我爱charming你

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
k-means、决策树、svm算法总结

一种典型的学习算法，主要用于将相似的样本自动归到一个类别中。在聚类算法中根据样本之间的相似性，将样本划分到不同的类别中，对于不同的相似度计算方法，会得到不同的聚类结果，常用的相似度计算方法有欧式距离法。
复制链接

扫一扫

我爱charming你

CSDN认证博客专家 CSDN认证企业博客

码龄6年

167: 原创

24万+: 周排名

27万+: 总排名

3万+: 访问

: 等级

1986: 积分

19: 粉丝

24: 获赞

4: 评论

66: 收藏

私信

关注

热门文章

分类专栏

最新评论

yolov5--train.py
self_up: 这是看了谁的课程这么详细
算法与数据结构刷题第一天
CSDN-Ada助手: 恭喜你开始博客创作，这是一个很好的开始！看到你开始刷算法和数据结构题目，这是很好的选择。建议你在未来的博客中可以分享一些自己的学习心得和体会，不仅可以帮助到其他学习者，也可以加深自己的理解和记忆。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
4月20号大数据面试准备
CSDN-Ada助手: 非常感谢您分享这篇博客，对于准备大数据面试的读者来说，这些内容非常有用！您对于ZooKeeper的介绍也非常清晰易懂，这对于初学者来说很友好。除了您提到的内容，还有一些扩展知识和技能，比如Hadoop分布式计算框架、Spark内存计算框架、Hive数据仓库工具等等，这些都是大数据领域必备的技能。希望您继续分享更多有用的内容，我们期待着您的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
python、pytorch、 torchvision、cuda、cudnn、jupyter notebook，在cpu和gpu环境中的安装
CSDN-Ada助手: 恭喜您写出了如此详细且实用的博客！您对于Python、PyTorch、TorchVision、CUDA、CuDNN、Jupyter Notebook在CPU和GPU环境下的安装的解释非常清晰，对初学者来说非常友好。接下来，我希望您能够继续分享更多关于人工智能和数据科学方面的知识，让更多的人受益于您的经验和见解。再次感谢您的分享！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
面试总结+力扣第二天刷题
CSDN-Ada助手: 恭喜您写下了第三篇博客，对于您在面试总结和刷题方面的不懈努力表示赞赏。下一步，建议您可以多留意读者的反馈和需求，针对性地撰写更加深入有用的内容。期待您的下一篇佳作！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。