二、数据挖掘的工具

数据挖掘的工具介绍

1.工具的分类

一般来说,数据挖掘工具根据其适用的范围分为以下两类。

1.1 通用数据挖掘工具

通用数据挖掘工具不区分具体数据的含义,采用通用的挖掘算法,处理常见的数据类型。
在这里插入图片描述

1.2 专用数据挖掘工具

针对某个特定领域的问题提供解决方案,在设计算法的时候充分考虑了数据、需求的特性。
在这里插入图片描述

2 数据挖掘工具选择

2.1 数据挖掘工具选择参考指标

  • 功能性:一个好的数据挖掘工具应该能够为每个步骤体哦那个相应的功能集;
  • 可伸缩性:指的是解决负责问题的能力;
  • 操作的简易性:提供友好的用户界面;
  • 可视化程度:数据源的可视化、模型的可视化、结果的可视化;
  • 开放性:数据挖掘工具与数据库(其它数据资源)的结合能力。

2.2 企业如何选择数据挖掘工具

  • 企业的数据挖掘需求;
  • 企业的数据挖掘经验和水平;
  • 企业的数据状态
  • 企业的预算和工具的性能
    在这里插入图片描述

3 商用的工具

3.1 SAS Enterprise Miner

  • SAS Enterprise Miner是一种通用的数据挖掘工具,按照“抽样-探索-转换-建模-评估”的方法进行数据挖掘。可以与SAS数据仓库和OLAP集成,实现从提出数据、抓住数据到得到解答的“端到端”的知识发现.
    在这里插入图片描述

3.2 DBMiner

  • DBminer是一个多任务数据挖掘系统,目的是把关系数据库和数据挖掘集成在一起;
  • 能完成多种知识发现:泛化、特性、关联、分类等规则;
  • 多种数据挖掘技术:面向属性的归纳、统计分析、机器学习等;
  • 提供交互式的类SQL语言——数据挖掘查询语言DMQL;
  • 能与关系数据库平滑集成。
  • https://www2.cs.sfu.ca/CourseCentral/459/han/tutorial/tutorial.html

4 数据挖掘开源工具

4.1 Weka

Weka是一款可视化的机器学习和数据挖掘软件,高级用户可以通过Java编程和命令行来调用其分析组件。同时,Weka也为普通用户提供了图形化界面。

  1. 优点:丰富的机器学习和数据挖掘算法库;
  2. 缺点:在统计分析方面较弱
    在这里插入图片描述

4.2 KNIME

KNIME提供了友好的开源数据集成、数据处理、数据分析和数据勘探平台。KNIME基于Eclipse并通过插件的方式来提供多种功能,并可以集成到各种各样的开源项目中。
在这里插入图片描述

4.3 Orange

Orange提供了友好的界面,Orange的强项在于提供了大量的可视化方法,可以对数据和模型进行多种图像化展示,而且支持智能 搜索合适的可视化形式,支持对数据的交互式探索。

  1. 优点:Orange的底层核心采用C++编写,提供了Python脚本语言进行扩展开发;
  2. 缺点:在统计分析分析能力不强,不支持统计检验
    在这里插入图片描述

5 总结

  • 数据挖掘工具分类
  1. 专用和通用数据挖掘工具
  • 数据挖掘工具选择
  1. 功能性:一个好的数据挖掘工具应该能够为每个步骤体哦那个相应的功能集;
  2. 可伸缩性:指的是解决负责问题的能力;
  3. 操作的简易性:提供友好的用户界面;
  4. 可视化程度:数据源的可视化、模型的可视化、结果的可视化;
  5. 开放性:数据挖掘工具与数据库(其它数据资源)的结合能力。
  • 数据挖掘商用工具
  1. SAS、SPSS、DBminer
  • 数据挖掘开源工具
  1. Weka、KNIME、Orange

挖掘商用工具

  1. SAS、SPSS、DBminer
  • 数据挖掘开源工具
  1. Weka、KNIME、Orange
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值