python(经典)数据标准化方法、聚类方法、分类方法总结:

本文总结了Python中的数据标准化方法,包括离差标准化、标准差标准化、归一化、二值化和独热编码。接着介绍了聚类方法,如k-means、层次分析和基于密度的方法,并列举了聚类模型的评价指标。此外,文章还讨论了分类模型,如逻辑回归、SVM和随机森林,并给出了评估分类模型的指标。最后提及了回归模型及其评价标准。
摘要由CSDN通过智能技术生成

(一)数据标准化的方法:
(1)离差标准化(最大最小值标准化)
(2)标准差标准化、
(3)归一化标准化
(4)二值化标准化
(5)独热编码标准化
为什么要进行数据标准化?什么时候需要进行数据标准化,什么时候不需要进行数据标准化?博主这里分析另一篇关于什么时候需要数据标准化的链接 https://blog.csdn.net/data_bug/article/details/87695229

(二)聚类的方法:
(1)划分法(k-means算法(k-均值算法),k-MEDOIDS算法(k-中心),CLARANS算法)
(2)层次分析方法(BIRCH算法,cure算法)
(3)基于密度的方法(DBSCAN算法,DENCLUS算法)
(4)基于网格的方法(STING算法,CLIOUE算法(聚类高维空间))
聚类模型评价的指标:
(1) 兰德系数(ARI评价法),需要真实值,最佳值为1,python里的sklearm函数adjust_rand_score
(2)互信息(AMI评价法),需要真实值,最佳值为1,python里的sklearm函数adj

  • 9
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值