数学建模竞赛中,有时参赛选手发现模型算法都有思路了,但是没数据!一个空壳模型是求不出结果的。那么如何找到所需数据呢?下面是整理的一些搜集数据的网站。
Google,SCI-Hub
用Google和SCI-Hub搜集数据资料是最高效的,最好用英文检索。但这两者的缺点也很明显,由于是外网,建议大家使用谷歌浏览器或者电脑自带的IE浏览器,并用Ghelper插件,再在Google和SCI-Hub搜索。
removing barriers in the way of sciencewww.sci-hub.ren
学校购买的数据库
不用Google的话,一般学校的图书馆网站都能免费使用各类期刊和数据库,国内常见的例如知网、中华数字书苑、万方数据、等等。
注意:一般需要登学校的内网或登录校园VPN,才可免费下载文献资料,直接去这些网站下载是要收费的。
Kaggle
Kaggle是一个进行机器学习竞赛、商家发布赛题数据和高手分享代码的平台,可以找到商家提供的真实数据和高手开源的代码,但网站和Google一样是外网。
Kaggle: Your Machine Learning and Data Science Communitywww.kaggle.com
统计局、自然资源部等官方网站
官方数据具有全面性和权威性,而且有些数据以柱状图、饼状图的形式展现。但同时数据过多、过于全面,反而会在选取所需数据的时候带来麻烦。
(注意:访问这些网站最好使用IE浏览器)
统计数据:
统计局:
自然资源部:
央行:
http://www.pbc.gov.cn/diaochatongjisi/116219/index.html
工信部:
http://www.miit.gov.cn/gxsj/index.html
交通运输部:
商务部:
http://www.mofcom.gov.cn/article/tongjiziliao/
(其他国家部门网站大多都有数据分页,如果需要可另行查找)
awesome-public-datasets
这是GitHub上的一个项目,包含了经济、地理、能源、教育等所有你能想到的领域的数据,其中大部分是免费的。
https://github.com/awesomedata/awesome-public-datasetsgithub.com
(如果网页打不开,可尝试用打开谷歌的方法)
EPSDATA平台
EPSDATA平台有丰富的数据资源和大量分析处理过的数据结果,是覆盖了多领域的综合性统计数据与分析平台。EPSDATA平台是收费的,不过可以申请7天的试用。
EPSDATA平台网址:
和鲸社区
类似kaggle,和鲸社区也是大数据竞赛平台,具有各种数据、大神经验和开源代码。