UCI数据集是一个常用的标准测试数据集,下载地址在
http://www.ics.uci.edu/~mlearn/MLRepository.html
我的主页上也有整理好的一些UCI数据集:
http://huangbo929.blog.edu.cn/user2/huangbo929/archives/2007/1725714.shtml
关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:
http://www.cs.waikato.ac.nz/ml/weka/很多的机器学习的经典算法都在里面。而且公布源程序,易于修改。
下载数据文件
http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
大家做数据挖掘研究时,
常常为找不到合适的数据而发愁。在KDNuggets上有Datasets栏目,提供一些数据集,网址为:http://www.kdnuggets.com/datasets/
还有另外一个很好的资源网址为:http://kdd.ics.uci.edu/