RapidMiner 5.3.015源代码下载并且正确的运行

一,RapidMiner介绍 
1, RapidMiner是一个开源数据挖掘工具,可以进行机器学习,数据挖掘,文本挖掘,预测性分析和商业分析,具有拖拽功能的图形化工具。无需编程。它开发且可扩展,拥有上百种数据载入,转化,建立和可视化的方法,可以连接到一系列复杂的数据源,如Excel,Access, IBM DB2, MySQL。你甚至可以很简单地利用RapidMiner提供的开放式扩展API将自己的算法嵌入到RapidMiner中。

2,rapidminer中的功能均是通过连接各类算子(operator)形成流程(process)来实现的,整个流程可以看做是工厂车间的生产线,输入原始数据,输出模型结果。算子可以看做是执行某种具体功能的函数,不同算子有不同的输入输出特性。

二,RapidMiner 5.3.015版本是开源的版本,现在要在IDEA上安装这个RapidMiner 5.3.015版本并且分析它,现在RapidMiner 7.3.0000版本不开源的。 
1,RapidMiner 5.3.015版本的界面如下: 
这里写图片描述

界面每个框架的介绍: 
这里写图片描述

2,RapidMiner 7.3.000版本的界面如下: 
这里写图片描述

三,RapidMiner 5.3.015源代码下载并且正确运行 
1,先下载好RapidMiner 5.3.015源代码,下载网址: 
http://download.csdn.net/detail/xwd18280820053/8906681

2,下载好的源代码如下: 
这里写图片描述

3,把RapidMiner 5.3.015源代码可以导入myeclipse或者IntelliJ IDEA。我这里是把项目导入了IntelliJ IDEA,导入后如下: 
这里写图片描述

4,导入后,出现了错误,错误就是找不到如下的包: 
import com.sun.javadoc.ClassDoc; 
import com.sun.javadoc.RootDoc; 
import com.sun.javadoc.SeeTag; 
import com.sun.javadoc.Tag; 
import com.sun.tools.doclets.Taglet; 

解决的方案: 
这些包就在我们的JDK中就有,打开我们的JDK安装目录,然后进入到lib目录, 
在里面的tools.jar就是了。即 jdkjdk1.8.0_91\lib\tools.jar. 
我的是如下: 
这里写图片描述

因为我的jdk是jdk1.8.0_91。然后把tools.jar包导入到刚才的项目里,如下: 
这里写图片描述

具体步骤: 
点击项目右键出现—-》Open Module Settings—>点击Modules—>中间点击绿色加号—–》找到刚才提到的tools.jar路径,添加tools.jar—-》点击Apply 确定即可。这样就可以解决刚才出现错误的地方了。 
这里写图片描述

5,解决了刚才的问题了,然后按如下步骤找到程序入口,并且运行它 
src—->com—->rapidminer—->gui——>RapidMinerGUI ,直接运行RapidMinerGUI,就可以了: 
这里写图片描述

因为 ,以GUI方式启动RapidMiner时,其入口是类com.rapidminer.gui.RapidMinerGUI 
main函数如下: 
这里写图片描述

6,运行其程序,界面如下: 
这里写图片描述

四,大家可以RapidMiner 5.3.015源代码进行研究了,尤其是算子的拖拽实现的代码也可以进行了解了。

表格,数据,文本集,日志,网址,测量值---这些以及其它类似的信息是每一个数据挖掘流程在一开始就要用到的。准备好的数据会被转化并合并,最后您会得到一个新的或是以不同方式显示出来的数据、模型或报告。在这一章我们会为您介绍如何用RapidMiner Studio处理这些信息。 5.1RapidMiner Studio的资源库 一旦您收集的流程及相关文件超过了一定的大小,您会发现RapidMiner会智能化的以一个一致的结构化的方式存储这些信息。其中一种可能性是以文件夹的形式存储流程。文件夹会根据流程分类,每一个流程的文件夹有一个目录,目录里面包含了输出数据,中间结果,报告等信息。 系统化、结构化地存储流程是个明智的选择,只有在极少的情况下我们会推荐选用普通的文件夹系统存储流程,因为普通文件夹存储系统很难满足数据挖掘方案的需求。因为不同的原因,例如机密性或者存储空间有限,会导致不能在本地电脑上创建文档。如果要在一个远程服务器上执行一个在本地电脑上创建的流程,就需要进行手动操作,例如复制流程及调整路径。创建流程,操作数据及评估分析结果都需要一个外部的权限和版本管理。以不同的格式存储的文件需要正确的参数设置,例如分隔符、新下载数据的代码。中间结果和流程变量的数量增长很快,这意味着您很容易就会无法跟踪这些数据。下载和查看数据,重新了解一下概况,这可能需要一个很长的流程甚至需要运行一个外部应用。文件注解能够让您更容易的掌控这些数据信息,但是普通的文件系统不支持这个功能。 RapidMiner应对所有这些问题的方法是资源库,它存储了所有的数据和流程。虽然我们也能从资源库以外的地方提取数据到流程中,但是外部提取数据需要运行外部流程等,而资源库可以为您提供很多便利:  结构化的数据、流程、分析结果和报告的存储位置说明了它们间相互关系,这些相互关系完全透明化的展现在用户面前。  不需要其他设置,您就可以打开或下载文件。只需点击一下,您就可以打开、查看数据或提取数据到流程中。您能够看到存储数据的概况,在不需要逐个打开这个文件的前提下,您可以随时为这些数据赋予特征、做上标记。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值