数据仓库,数据分析,不涉及商业方面的高层决策之用,故本篇文章只适合初学数据仓库,为了完成老师作业,且想用weka做简单数据挖掘之用的童鞋。
weka版本是3.6.2,数据库库是SQL Server 2005,没办法,老师提供的几万条数据保存在excel表中,如果从excel转为csv格式,再从weka中导入该csv文件,涉及到格式的转换,很是麻烦~况且几万条数据,不可能一条一条去检查它们的格式,故思路是,先在sql server中建立一个数据库(db_ppz),把csv中的几万条数据导入到数据库db_ppz中,再从weka中连接sql server读取数据,速度还可以啦~~
weka下载地址:一个是自带了jdk,一个没带jdk,文件体积少点。。。
http://www.cs.waikato.ac.nz/~ml/weka/