weka使用笔记1-FPGrowth注意事项和参数说明

weka是一个很好的数据挖掘实验的工具,可以进行标准的数据挖掘的各种实验,首先来说一下关联规则的挖掘。

在linux环境下,在使用weka之前,要配置好环境变量,将weka目录下的weka.jar的位置加到classpath中,然后就可以调用weka的命令行进行数据挖掘了。weka的apriori算法优化非常不好,相当占用内存,大约50w的属性开14G的内存都不够用,所以如果在本机进行数据量较大的实验的话,要选FPGrowth算法。FPGrowth算法只需要扫面两遍数据库,虽然他是递归的选择rules的,也比较占用内存,但是如果有4G以上的内存的话,基本上就够用了。至于FPGrowth的算法实现,就不做赘述了,网上一大堆,理解起来也不是很难。

weka默认的数据形式是.arff格式的,arff格式很简单,支持稀疏格式,一般的关联规则都要用稀疏格式的数据,提醒一点的是,构建稀疏格式的arff文件的时候,数据行上一定不要忘记加上{}。

FPGrowth的参数:-t,系统默认参数,是指定要进行挖掘的数据文件的;-N,是给出要输出多少条规则;-T是指定选择哪个量进行排序,weka提供四种排序方法,0=confidence ,1=lift , 2=leverage , 3=Conviction。4种参数代表的意义一查就有,0,1,3都是越大越好,2一般出来都是0。-C是指你选定的那个排序参数的那个最小值,-M是是支持度的最小值,-U是支持度的最大值。

进行挖掘的时候如果想把输出结果保存的话,可以利用linux的管道,命令后面加上| tee yourFilename就好了。

转载于:https://www.cnblogs.com/fbiswt/archive/2012/10/20/2732422.html

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: weka-3-8-6-azul-zulu-windows.exe是一款用于数据挖掘和机器学习的免费开源软件Weka的安装程序。它采用了Azul Zulu OpenJDK平台,可在Windows系统上运行。Weka可以处理各种数据,并提供大量数据挖掘和机器学习算法,以帮助用户发现数据的规律和模式。它还具有图形用户界面和命令行界面,使其易于使用Weka被广泛用于学术界和工业界,它的应用包括医疗、金融、商业和社交媒体等领域。对于那些对数据挖掘和机器学习感兴趣的人来说,Weka是一个强大的工具,可以帮助他们分析和理解数据。 ### 回答2: weka-3-8-6-azul-zulu-windows.exe 是一款开源的机器学习软件WeKa的安装包,适用于Windows操作系统WeKa是由新西兰Waikato大学开发的一款数据挖掘工具,它提供了一系列的机器学习算法和数据预处理工具,包括分类、聚类、回归等常见的算法。azul-zulu是一款Java运行时环境,用于运行基于Java编写的应用程序。因此,weka-3-8-6-azul-zulu-windows.exe包含了WeKa软件及其所需的Java运行时环境。 下载weka-3-8-6-azul-zulu-windows.exe后,用户可以通过简单的安装流程将WeKa软件及其依赖的Java环境安装到自己的电脑上。安装完成后,用户可以通过WeKa提供的图形界面或者命令行界面进行数据挖掘和机器学习任务的分析和建模。WeKa被广泛应用于数据挖掘和机器学习领域,可以帮助用户处理和分析各种类型和规模的数据集。同时,WeKa还提供了丰富的文档和示例,方便用户学习和使用。总之,weka-3-8-6-azul-zulu-windows.exe是一款非常实用的数据挖掘工具软件,可以帮助用户掌握和应用机器学习技术,从而更好地处理和分析数据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值