入门:
Weka官网 :Weka安装目录下有Documentation,Wiki,Manual等。有一本官方的书。
Coursera有一门课。
使用Weka时,在构建模型的时候,如果数据量比较大,经常会遇到下面两个错误,查看Log会看到。
java.lang.OutOfMemoryError:GC overhead limit exceeded
java.lang.OutOfMemoryError: Java heap space
解决办法:启动Weka的时候加参数
java -XX:-UseGCOverheadLimit -Xmx1024m -jar weka.jar
有关博客:
Weka学习笔记:很多Java纯代码。绝对要看。总共有53篇博客,简单易懂。
Weka开发:纯天然手撕Weka代码,一堆源码分析,这个也必须看。
使用Weka命令行实现了一个文本分类:很详细(另外 Java代码版本)
- 数据挖掘简述和weka介绍–数据挖掘学习和weka使用(一)
- 输入数据与ARFF文件–数据挖掘学习和weka使用(二)
- 数据预处理和weka.filters的使用–数据挖掘学习和weka使用(三)
- OneR算法和weka中OneR使用–数据挖掘学习和weka使用(四)
- RIpple-DOwn Rule算法和weka中Rider使用–数据挖掘学习和weka使用(五)
Online Resources & Reference Material:DePaul University的Web Data Mining
for Business Intelligence课程资料