前段时间在使用数据挖掘工具weka对大量数据进行挖掘,首先通过自己编写的一个小程序将原始数据转换成了arff格式的文档, 但是可能是因为数据量大,weka计算不出来。 也可能是weka为了通用性对输入的数据进行了处理,也就是说在内部进行了转换成统一格式,而恰恰这个转换过程需要消耗很多资源。因此会出现这样error:out of memory 之类的提示。这个时候你就可以考虑空值了。就是将没有意义的数据设置成weka默认的空值null(在weka中是用?替代null),这样weka在计算时只计算有意义的数据(对我们有用的数据,我们要提取的数据)。
基于weka的关联规则挖掘及其apriori算法的应用
最新推荐文章于 2023-11-13 16:21:29 发布