Python数据分析与挖掘实战学习17

本文详细介绍了Python中的K-Means聚类算法,包括算法过程、数据类型与相似性的度量、目标函数及评价方法。通过实例展示了K-Means如何对连续属性和文档数据进行聚类,并提供了代码实现和结果分析。
摘要由CSDN通过智能技术生成

一、Python分类预测模型特点

模型

模型特点

位于

逻辑回归

比较基础的线性分类模型,很多时候是简单有效的选择

Sklearn.linear_model

 

SVM

强大的模型,可以用来回归、预测、分类等,而根据选取不同的核函数,模型可以是线性的/非线性的

 

Sklearn.svm

决策树

基于“分类讨论、逐步细化”思想的分类模型,模型直观、易解释

Skearn.tree

 

随机森林

思想与决策树类似,精度通常比决策树要高,缺点是由于其随机性,丧失了决策树的可解释性

 

Sklearn.ensemble

朴素贝叶斯

基于概率思想的简单有效的分类模型,能够给出容易理解的概率解释

Sklearn.naive_bayes

 

神经网络

具有强大的拟合能力,可以用于拟合、分类等,他有很多个增强版本,如递神经网络、卷积神经网络、自编码器等,这些都是深度学习的模型基础

 

Keras

二、聚类分析

1.常用聚类分析算法

与分类不同,聚类分析是在没有给定划分类别的情况下,根据数据相似度进行样本分组的一种方法。与分类模型需要使用有类标记样本构成的训练数据不同,聚类模型可以建立在无类标记的数据上,是一种无监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度将其划分为若干组,划分的原则是组内距离最小化而组间(外部)距离最大化。

常用聚类方法如下表所示:

类别

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值