数据集网站集合

常见数据集网站

UCI(http://archive.ics.uci.edu/ml/index.php):
UCI数据库是加州大学欧文分校提出的用于机器学习的数据库,如果正在寻找与机器学习库相关的数据集,通常是第一个去的地方。

Kaggle(https://www.kaggle.com):
另一个找到免费数据集的好地方。

天池(天池大数据众智平台-阿里云天池):
中国著名的数据科学竞赛平台,也提供数据。

GitHub(https://github.com):
一个非常全面的数据获取渠道,宝藏网站。

data.world(https://data.world/ 

data.world是一个拥有大量免费数据集的网站,包含金融,犯罪,经济,推特,美国宇航局等的各种各样的数据集。

FiveThirthyEight(https://fivethirtyeight.com/

FiveThirthyEight大量存储免费数据集和专门用于数据科学的丰富文章。

AWS(https://aws.amazon.com/cn):
亚马逊的跨科学云数据平台。

较冷门的数据集网站

CEIC(https://www.ceicdata.com/zh-hans):
能够精确查找GDP、CPI、进口、出口、外资直接投资、零售、销售以及国际利率等深度数据。

万得(https://www.wind.com.cn):
万得的数据内容涵盖股票、基金、债券、外汇、保险、期货、金融衍生品、现货交易、宏观经济、财经新闻等领域。

BuzzFeed(https://www.buzzfeed.com/

BuzzFeed是一家新闻和娱乐内容的跨平台数字媒体公司,也提供免费数据集。

国家统计局(国家统计局):
国家统计局,包含了我国经济、人口、民生等多个方面的数据。

中国统计信息网(中国统计信息网)​:
国家统计局的官方网站,汇集了全国各级政府各年度的国民经济和社会发展统计信息。

Data.gov(https://www.data.gov/

Data.gov是美国政府开源数据的网站。

DataCastle(​​​​​​​DC竞赛——领先的大数据与人工智能竞赛平台):
DataCastle是一个偏竞赛的数据集网站。

Socrata OpenDatahttps://opendata.socrata.com/

Socrata OpenData是一个包含多个免费数据集的网站。

Figshare(​​​​​​​figshare - credit for all your research

一个基于云计算技术的在线数据知识库。

Quandlhttps://www.quandl.com/

Quandl是一个经济和财务数据库,提供已经清理过的数据。

Datafountain(​​​​​​​权威的大数据竞赛平台 - DataFountain)​:
DataFountain也是一个偏竞赛的数据集网站。

Reddit(https://www.reddit.com/r/datasets/

Reddit是一个受欢迎的社交新闻网站,也致力于分享有趣的数据集。

搜数网(http://www.soshoo.com/index.do):
搜数网汇集了中国资讯行自1992年以来收集的所有统计和调查数据,内容全面、可靠。

学术洪流(https://academictorrents.com/

Academic Torrents是研究人员共享数据的平台。

  • 7
    点赞
  • 118
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值