最近在公司实习做电商评论相关的数据分析,需要调几个分类器,组里的代码一贯用Java编写,为了提高工作效率,找了找Java环境下的机器学习工具库,发现了Weka这个神奇的东西。
Weka介绍及下载
Weka是一个Java编写的具有10几年历史的开源机器学习与数据挖掘软件,曾获得SIGKDD颁发的数据挖掘领域内最高服务奖。
上面这张图就是Weka的主页面,GUI做得很简陋,但它的功能的确非常强大。而且它不仅可以通过GUI操作,还有CLI(command-line interface)命令行模式,而且因为它的源码使用java编写,所有它的jar包还可以导入java的工程中,直接调用api。
我们今天先简单分享一下在使用GUI的过程中遇到的一些问题。