Python数据分析与挖掘实战学习17

最新推荐文章于 2024-09-05 10:03:06 发布

李丰田丶

最新推荐文章于 2024-09-05 10:03:06 发布

阅读量343

点赞数

文章标签：聚类算法神经网络 python 数据挖掘

本文链接：https://blog.csdn.net/qq_37170467/article/details/111814307

版权

本文详细介绍了Python中的K-Means聚类算法，包括算法过程、数据类型与相似性的度量、目标函数及评价方法。通过实例展示了K-Means如何对连续属性和文档数据进行聚类，并提供了代码实现和结果分析。

摘要由CSDN通过智能技术生成

一、Python分类预测模型特点

模型	模型特点	位于
逻辑回归	比较基础的线性分类模型，很多时候是简单有效的选择	Sklearn.linear_model
SVM	强大的模型，可以用来回归、预测、分类等，而根据选取不同的核函数，模型可以是线性的/非线性的	Sklearn.svm
决策树	基于“分类讨论、逐步细化”思想的分类模型，模型直观、易解释	Skearn.tree
随机森林	思想与决策树类似，精度通常比决策树要高，缺点是由于其随机性，丧失了决策树的可解释性	Sklearn.ensemble
朴素贝叶斯	基于概率思想的简单有效的分类模型，能够给出容易理解的概率解释	Sklearn.naive_bayes
神经网络	具有强大的拟合能力，可以用于拟合、分类等，他有很多个增强版本，如递神经网络、卷积神经网络、自编码器等，这些都是深度学习的模型基础	Keras

二、聚类分析

1.常用聚类分析算法

与分类不同，聚类分析是在没有给定划分类别的情况下，根据数据相似度进行样本分组的一种方法。与分类模型需要使用有类标记样本构成的训练数据不同，聚类模型可以建立在无类标记的数据上，是一种无监督的学习算法。聚类的输入是一组未被标记的样本，聚类根据数据自身的距离或相似度将其划分为若干组，划分的原则是组内距离最小化而组间（外部）距离最大化。

常用聚类方法如下表所示：

类别

最低0.47元/天解锁文章

李丰田丶

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python数据分析与挖掘实战学习17

一、Python分类预测模型特点模型模型特点位于逻辑回归比较基础的线性分类模型，很多时候是简单有效的选择 Sklearn.linear_model SVM 强大的模型，可以用来回归、预测、分类等，而根据选取不同的核函数，模型可以是线性的/非线性的 Sklearn.svm 决策..
复制链接

扫一扫