人工智能——数据挖掘1

1.概述

从技术角度,数据挖掘(data mining)是从大量的不完全的、有噪南的(模糊的随机的实际应用数据中提取隐含在其中的、人们事先不知道的,但又是潜化有用的信身和知识的过程。与数据挖掘相近的同义词包括数据融合、数据分析和决策持第。预处理过程这一定义包括好几层含义:数据源必须是真实的、海量的、含噪声的:发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。

从商业角度,数据挖掘是一.种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性信息。

简言之,数据挖掘其实是一类深层次的数据分析方法。因此,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的有效方法。

数据挖掘作为一一门新兴的交叉学科,涉及数据库系统、数据仓库、统计学、机器学习、可视化、信息检索和高性能计算等诸多领域。

此外数据挖掘还与神经网络、模式识别、空间数据分析图像处理、信号处理、概率论、图论和归纳逻辑等领域关系密切。

数据挖掘与统计学有密切关系.近几年.人们逐渐发现数据挖掘中有许多工作是由统计方法来完成的。甚至有些人(尤其是统计学家)认为数据挖掘是统计学的一个分支, 当然大多数人(包括绝大多数数据挖掘研究人员)并不这么认为。

但是,统计学和数据挖掘的目标非常相似,而且数据挖掘中的许多算法也源于数理统计,统计学对数据挖掘发展的贡献功不可没。

数据挖掘与传统数据分析方法主要有以下两点区别:

首先,数据挖掘的数据源与以前相比有了显著的改变,包括数据是海量的,数据有噪声,数据可能是非结构化的。

其次,传统的数据分析方法一般都是先给出一个假设,然后通过数据验证,在一定意义上是假设驱动的;与之相反,数据挖掘在一定意义上是发现驱动的,模式都是通过大量的搜索工作从数据中自动提取出来的。即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。

在缺乏强有力的数据分析工具而不能分析这些资源的情况下,历史数据库也就变成了“数据坟墓”里面的数据几乎不再被访问。也就是说,极有价值的信息被“淹没”在海量数据堆中,领导者决策时只能凭自己的经验和直觉。因此改进原有的数据分析方法,使之能够智能地处理海量数据,也就演化为数据挖掘。

研究数据挖掘的目的,不再是单纯为了研究,更主要的是为商业决策提供真正有价值的信息进而获得利润。目前所有企业北面临的一个共同问题是,企业数据量非常大.而其中真正有价值的信息却很少,因此需要经过深层分析,从大量的数据中获得有利于商业运作,提高竞争力的信息,就像从矿石中石中淘金一样.数据挖掘也由此而得名。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值