自己整理的资料:
牛人总结:
包括各种文本,图像,视屏和声音的数据库:KDD CUP,加州大学里恩分校的数据库等等。。。
http://www.zhizhihu.com/html/y2012/4034.html
这个。。重量级,好多东西~
http://m.sciencemag.org/site/feature/data/compsci/machine_learning.xhtml
自己最近用到的:
http://www.cs.nyu.edu/~roweis/data.html
部分NIPS论文集
http://ai.stanford.edu/~gal/Data/NIPS/
Presidential State-of-the-Union speeches from 1790 to 2002
http://infomotions.com/etexts/gutenberg/dirs/etext04/suall11.txt