数据挖掘(入门知识)



最近在看一本叫《大话数据挖掘》的书,简单的摘要总结一些数据挖掘的基础理论知识:

     1.Data Mining(在学术界也叫KDD:knowledge discovery in database) ,就是从大量的、不完全的、有噪声的、模糊的、随机的 数据中,提取隐含在其中的,我们事先不知道的、又潜在有用信息的知识的过程。(大多算法建立在:统计学的大数定律基础上)

     2.Data Mining 能做什么: 数据挖掘任务包括描述性任务预测性任务两种:

描述性任务包括聚类、关联分析、序列、异常检测等,

预测性任务包括回归和分类

(1):关联规则挖掘   (1994 Apriori 算法):也包括序列和时间序列                                              

(2):聚类分析(连续:K-means,K-Medoids,

(离散:K-模,k_原型)

(非球状簇:基于密度的聚类算法:DBSCAN、OPTICS、DENCLUE)

(层次聚类算法:凝聚&&分裂)

(视觉聚类算法)

(3)预测:基本原理是黑箱子模型(不管输入输出之间的具体关系是什么,只关系他们之间的联系,而不在乎他们之间的因果关系)

(4)回归:线性回归,线性拟合

(5)偏差的检测:对分析对象的少数的、极端的特例的描述,揭示内在的原因

后续补充。。。




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值