《数据挖掘导论》第一章之绪论

数据挖掘数学基础:

                             线性代数, 维度规约, 概率统计, 回归和优化

 

数据挖掘涵盖领域:

                 数据预处理,可视化,预测建模,关联分析,聚类,异常检测

 

数据挖掘涵盖主题:

               数据,分类,关联分析,聚类,异常检测

 

数据挖掘必要基础知识:

                       统计学,线性代数,机器学习

 

数据库中知识发现(KDD):

                       (1)数据预处理:    特征选择,维规约,规范化,选择数据子集

                       (2)数据挖掘:

                       (3)后处理:       模式过滤, 可视化, 模式表示

 

数据挖掘借鉴的领域:

                                 (1)统计学: 抽样,估计和假设检验

                                 (2)人工智能,模式识别和机器学习:  搜索算法,建模技术和学习理论

                                   (3)最优化,进化计算,信息论,信号处理,可视化,信息检索

 

数据挖掘任务分类:

                                (1)预测任务:  根据 自变量 预测 因变量

                                 (2)描述任务: 导出概括数据中潜在联系的模式

                                                          (相关,趋势,聚类,轨迹和异常)

 

 

 

本书主要讲述数据挖掘任务:

                                       (1)预测建模:

                                                                      分类(classification):预测离散的目标变量

                                                                       回归(regression):预测连续的目标变量

                                       (2)关联分析:

                                                                  描述数据中强关联特征的模式

                                                                    模式:用蕴涵规则或特征子集的形式表示

                                       (3)聚类分析:发现紧密相关的观测值组群,使得属于统一簇的观测值之间尽可能相似

                                       (4)异常检测:识别异常点离群点

                                                                 异常点(离群点): 特征显著不同于其他数据的观测值。

 

               

 

 

 

 

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值