为什么需要OLEDB For DataMining?

虽然数据挖掘中的一些技术在20世纪60年代开始出现,但是数据挖掘的概念是最近出现的。OLE DB for Data Mining (OLE DB for DM)应用编程接口在20007月出现,之前的数据挖掘市场是非常零散的,就像20世纪70年代关系数据库之前的数据库市场。没有挖掘模型、模型训练和预测的标准概念。对于许多人来说,数据挖掘就是一组算法的集合,就像早些时候人们认为数据库只不过是存储数据的分层数据结构。数据挖掘作为一种高端工具,不仅适用于研究统计学和机器学习的博士们,而且适用于数据库开发人员。

       20世纪90年代,市场上存在着许多数据挖掘软件。这些软件的厂商(ISV)都有不同的创建数据挖掘应用程序的方法。每个数据挖掘软件都包括自己的算法,自己的模型存储格式,自己的数据清理工具,甚至自己的报告工具。数据挖掘是一个独立的软件包,并不是数据仓库的一部分。

       除了缺少数据挖掘的标准概念,还缺少标准的应用编程接口。将数据挖掘的结果同用户的应用程序集成起来是非常困难的。许多数据挖掘软件没有应用编程接口。商业软件中如果要集成数据挖掘的特性是件非常痛苦的事情。有些数据挖掘软件生成决策树、神经网络的源程序。这些源程序包括模型的训练参数,比如神经网络的系数。为了部署挖掘模型,需要编译源代码,与用户应用程序连接。因此,数据挖掘项目都由厂商封锁。如果你在数据挖掘项目中选择了产品A,后来发现在时间序列算法上产品B更好,那就不得不从头开始项目,因为集成到用户应用程序时,不同的产品有不同的数据转换工具、模型存储格式和应用编程接口。

       OLE DB for Data Mining的目标是定义数据挖掘的通用概念和通用的应用编程接口,与数据库领域的SQL类似。这些应用编程接口很容易被数据库开发人员理解,而不仅仅适用于那些研究统计学的博士们。19997月,OLE DB for Data Mining被微软和许多数据挖掘厂商共同提出,一年后在微软网站上发布1.0版本。OLE DB for Data Mining应用编程接口定义了通用的数据挖掘概念,比如挖掘模型、模型训练、模型内容、模型预测等等。OLE DB for Data Mining还定义了数据挖掘查询语言。这种查询语言的语法与SQL类似。随着标准的发布,一些数据挖掘软件厂商,包括Microsoft, Megaputer, Angoss, KXEN, DBMiner,都开发了它们的OLE DB for Data Mining 提供者。

       通过 OLE DB 或者 ADO ,用户应用程序可以连接不同的数据挖掘软件提供者,如下图所示。每个 OLE DB for Data Mining 提供者都有数据挖掘算法集。它们的算法可以通过 OLE DB 访问各种格式的数据源。数据源的存储格式可以是关系型数据库、 OLAP 立方体、文本文件和 email 文档等。  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值