数据挖掘 (4):

一、KNN

算法原理:找到K个与新数据最近的样本,取样本中最多的一个类别作为新数据的类别

算法的优点 :01简单易实现。2、对于边界不规则的数据效果较好

算法的缺点:只适合小数据集、数据不平衡效果不好、必须要做数据标准化、不适合特征维度态度的数据

关于K的选取:K值的选取会影响到模型的效果
K越小的时候容易过拟合,K越大的时候容易欠拟合

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

二、决策树

在这里插入图片描述
最终形成的这棵树上,所有的叶子节点都是要输出的类别信息
所有的非叶子节点都是特征信息

优点:非常直观,可解释极强、既可以处理离散值也可以处理,连续值,还可以处理缺失值、预测速度比较快

缺点:容易过拟合、需要处理样本不均衡的问题

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

三、朴素贝叶斯

算法的优点

  • 逻辑清晰简单、易于实现,适合大规模数据
  • 运算开销小
  • 预测过程快
  • 对于噪声点和无关属性比较健壮

算法的缺点

  • 在具体应用的时候要考虑特征之间的相互独立性再决定是否要使用该算法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

四、支持向量机(SVM)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

六、人工神经网络

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

七、XGB (实践)

在这里插入图片描述
在这里插入图片描述

八、K-mean聚类

在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值