基于weka的关联规则挖掘及其apriori算法的应用

最新推荐文章于 2023-11-13 16:21:29 发布

luckygyz

最新推荐文章于 2023-11-13 16:21:29 发布

阅读量1.4k

点赞数 1

分类专栏：数据挖掘

本文链接：https://blog.csdn.net/luckygyz/article/details/17393609

版权

数据挖掘专栏收录该内容

5 篇文章 0 订阅

订阅专栏

前段时间在使用数据挖掘工具weka对大量数据进行挖掘，首先通过自己编写的一个小程序将原始数据转换成了arff格式的文档，但是可能是因为数据量大，weka计算不出来。也可能是weka为了通用性对输入的数据进行了处理，也就是说在内部进行了转换成统一格式，而恰恰这个转换过程需要消耗很多资源。因此会出现这样error：out of memory 之类的提示。这个时候你就可以考虑空值了。就是将没有意义的数据设置成weka默认的空值null（在weka中是用？替代null），这样weka在计算时只计算有意义的数据（对我们有用的数据，我们要提取的数据）。