数据挖掘基本模型一览

这篇博客涵盖了数据挖掘的主要步骤和模型,包括数据准备时的缺失值处理(如平均值填充、KNN填充)、线性回归、降维技术(如PCA、LDA)、聚类算法(如K-means、DBScan)、分类方法(如逻辑回归、SVM、神经网络)以及深度学习(如RBM、DBN、卷积网络)。此外,还讨论了异常检测和推荐系统的基本原理。
摘要由CSDN通过智能技术生成

数据准备

    缺失值处理

          直接删除

          不处理

          填充

                   平均值填充 Mean/Model Completer

                   热卡填充 Hot Deck Imputation

                   K邻近 KNN

                   使用所有可能的值填充 Assigning All Possible values of the Attribute

                   组合完整化方法 Combinatorial Completer

                   线性回归

                   多重填充

                   期望值最大化方法(Expectation maximization,EM)          

                   多重填补(Multiple Imputation,MI)         

                  C4.5方法

                   粗糙集方法

                   关联规则

                   神经网络

                   贝叶斯网络

    ETL

    降维             

         主成份分析 PCA

         线性判别分析 LDA

         等距映射 LPP

         局部线性嵌入 Isomap

         特征映射 LLE

         局部保留投影

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值