世界最大的社会科学文献网站 可以找到大量的数据集 :
http://www.icpsr.umich.edu/icpsrweb/ICPSR/
UC Irvine Machine Learning Repository
http://archive.ics.uci.edu/ml/
数据堂
http://www.datatang.com/
数据堂由国家科技部大力支持,与国内外著名科研机构、高等院校、研发企业通力合作,积累了丰富的科研数据资源,通过统一的平台提供服务,使得科研机构、企业、高校和个人之间实现充分的数据共享。通过该平台,让更多的科研人员进一步发掘和利用这些科学数据的价值,促进我国科学研究水平的提高,使得政府财政投入科研活动的价值得到进一步提升,使得参与其中的各类科研组织、研发企业迅速提升学术影响力、社会影响力。(个人评价,晕,好久不更新)
myPersonality Project
http://mypersonality.org/wiki/doku.php?id=start
Awesome Public Datasets
https://github.com/caesar0301/awesome-public-datasets
The Yahoo Webscope Program
http://webscope.sandbox.yahoo.com/
欢迎大家补充!