数据挖掘

 数据挖掘的定义::

数据挖掘(Data Mining),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘的广义观点:数据挖掘就是从存放在数据库,数据仓库或其他信息库中的大量的数据中挖掘有趣知识的过程。数据挖掘,又称为数据库中知识发现(Knowledge Discovery in Database, KDD) 也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。知识发现过程以下步骤组成:(1)数据清理,(2)数据集成,(3)数据选择,(4)数据变换,(5)数据挖掘,(6)模式评估,(7)知识表示。数据挖掘可以与用户或知识库交互。

何为知识:

从广义上理解,数据、信息也是知识的表现形式,但是人们更把概念、规则、模式、规律和约束等看作知识。人们把数据看作是形成知识的源泉,好像从矿石中采矿或淘金一样。原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到数据挖掘这一新兴的研究领域,形成新的技术热点。

 

 

数据挖掘的起源

需要是发明之母。存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。

      数据挖掘利用了来自如下一些领域的思想:(1) 来自统计学的抽样、估计和假设检验,(2) 人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也接纳了很多来自其他领域的思想。并且这些思想为数据挖掘奠定了坚实的基础。起到了很好的支撑作用

数据挖掘能做什么

1)数据挖掘能做以下六种不同事情(分析方法):

  A 分类 Classification

  B 估值(Estimation

  C 预言(Prediction

  D 相关性分组或关联规则(Affinity grouping or association rules

  E 聚集(Clustering

  F 描述和可视化(Description and Visualization

  G 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)

 

2)数据挖掘分类

  以上六种数据挖掘的分析方法可以分为两类:直接数据挖掘;间接数据挖掘

  · 直接数据挖掘

  目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以理解成数据库中表的属性,即列)进行描述。

  · 间接数据挖掘

  目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系 。

  · 分类、估值、预言属于直接数据挖掘;后三种属于间接数据挖掘

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值