机器学习笔记

kiki--

已于 2023-07-17 18:14:07 修改

阅读量73

点赞数

文章标签：机器学习人工智能

于 2023-07-16 00:03:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_52484011/article/details/131745300

版权

聚类分析是数据挖掘的一种方法，常用于无先验知识的情况，通过距离度量相似性。K-means是一种常见的聚类算法，目标是最小化簇内差异并最大化簇间差异。Python中使用sklearn库的KMeans模型进行聚类，关键参数包括设置类别数n_clusters。

摘要由CSDN通过智能技术生成

非监督学习

聚类分析常用于数据探索或挖掘前期

没有先验经验做探索性分析
样本量较大时做预处理

常用于解决

数据集可以分几类；每个类别有多少样本量
不同类别中各个变量的强弱关系如何
不同类型的典型特征是什么

一般应用场景

群类别间的差异性特征分析
群类别内的关键特征提取
图像压缩、分割、图像理解
异常检测
数据离散化

聚类分析缺点：

无法提供明确的行动指向
数据异常对结果有影响

聚类方法的关键：距离。两个样本间的距离越小，说明它们之间越相似，越有可能聚成一个类群。相反，两个样本间的距离比较大，说明它们相差越大，越有可能隶属于不同的类群。

通过聚类算法，即使在没有任何先验知识的情况下，基于样本的数据特征，把相似或相近的样本划分为一群，把差异较大或相远的样本划分到另一群，从而形成不同的“簇”

常用聚类方法：

一、K—means聚类分析：基于点与点之间的距离的相似度来计算最佳类别归属。

Kmeans在进行类别划分过程中及最终结果，始终追求“簇内差异小，簇间差异大”，

其中差异由样本点到其所在簇的质心的距离衡量。

python语法：

sklearn.cluster.KMeans(n_clusters=8, init='k-means++', n_init=10, max_iter=300, tol=0.0001, precompute_distances='auto', verbose=0, random_state=None, copy_x=True, n_jobs=None, algorithm='auto')

参数详解：

n_cluster：k，告诉模型我们要分几类，默认8，必填；

有监督学习

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄4年

13
原创

1
点赞

24
收藏

2
粉丝

关注

私信

热门文章

最新评论

python连接数据库
CSDN-Ada助手: 恭喜您写完了第11篇博客！标题为“python连接数据库”的内容确实很有吸引力。我很高兴看到您在持续创作，并分享有关数据库连接的知识。不过，如果我可以提一个谦虚的建议的话，您可以考虑在下一篇博客中展示一些实际的示例，比如如何使用Python连接到不同类型的数据库，以及如何执行基本的查询和更新操作。这样的实际示例会使您的博客更加生动和实用。期待您在未来的创作中再接再厉！
机器学习笔记
CSDN-Ada助手: 恭喜您写完了第12篇博客《机器学习笔记》！您的持续创作精神令我钦佩不已。通过这篇博客，您向读者们分享了关于机器学习的重要笔记，这对于那些想要深入了解这个领域的人们来说无疑是一份宝贵的资料。在下一步的创作中，或许您可以考虑深入探讨某些机器学习算法的实际应用案例，或者分享一些您在实践中遇到的挑战和解决方案。这样的内容无疑会吸引更多读者，并为他们提供更实用的经验与见解。继续保持谦逊的态度，您的博客将继续为读者们提供宝贵的知识分享。期待您未来更多精彩的创作！
回归分析——逻辑回归和线性回归
CSDN-Ada助手: 恭喜您撰写了第13篇博客！标题“回归分析——逻辑回归和线性回归”非常吸引人。您在这篇博客中深入探讨了逻辑回归和线性回归，这是一个非常有价值的主题。我对您的努力和持续创作精神表示由衷的赞赏。在下一步的创作中，我建议您可以进一步扩展您的博客内容，比如介绍一些实际应用案例，或者提供一些实用的技巧和建议。这将帮助读者更好地理解和应用回归分析，并使您的博客更具实用价值。谦虚地说，您的写作风格和表达方式非常清晰易懂，但我认为您可以尝试加入一些个人观点和经验分享，这样可以更好地与读者产生互动和共鸣。同时，您也可以考虑与其他领域的专家进行交流，以便拓宽思路和深化对回归分析的理解。再次恭喜您的持续创作，期待您在未来的博客中带来更多有趣和有益的内容！
sql—count() 中加表达式计数
CSDN-Ada助手: 恭喜您写了第10篇博客，对于sql中count()加表达式计数的讲解也让我受益匪浅。希望您能继续坚持创作，分享更多有价值的知识。下一步建议可以从sql的高级应用方面深入探讨，让读者更深入地了解这个领域。再次感谢您的分享和付出。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。