2015年国际科学理事会发布《Open Data in a Big Data World》协议。该协议是“2015年国际科学”的成果,是国际科学四大顶级代表(国际科学理事会 - ICSU,国际合作伙伴关系 - IAP ,世界科学院 - TWAS和国际社会科学理事会 - ISSC)系列年度会议的第一次。旨在代表全球科学界在科学领域的国际政策。该协议将数据革命的机遇和挑战确定为当今全球科学政策的主要问题。该协议认为“大数据”已经成为科学发现的重要机会,而“开放数据”将提高公共研究企业的效率,生产力和创造力,并抵消知识私有化的趋势。此外,同时公开发表支持科学论文的数据可以为科学的“自我纠正”提供基础。
参考资料:
Annual Open Data Plan for 2018
International Open Data Charter
纽约政府开放数据平台
https://opendata.cityofnewyork.us/
美国官网数据超市
提供230,256个数据集、14个数据目录
新加坡政府开放数据平台
提供1700个数据集、9个数据目录
休斯顿市开放数据门户网站
247个数据集、12个数据目录
Academic Torrents
共享大量数据集的分布式系统,提供445.96TB的研究数据
http://hadoopilluminated.com/hadoop_illuminated/Public_Bigdata_Sets.html
提供国外开放数据网站相关信息,目前已集合35个查询途径
United States Census Bureau
美国人口普查局
http://USGovXML.com是美国政府提供的公共Web服务和XML数据源的索引。http://USGovXML.com索引来自 美国政府所有3个分支机构以及董事会,委员会,公司和独立机构的数据来源。
快速搜索和分析政府、公司和组织发布的数十亿份公共记录。
发现和分享高质量数据集,与他人联系和分享知识。
http://Aws.Amazon.Com/Datasets
https://registry.opendata.aws/
帮助人们发现和共享通过AWS资源提供的数据集。
开放数据网站导航
金融,经济和替代数据集的主要来源,为投资专业人士提供服务。Quandl的平台被超过40万人使用,其中包括来自世界顶级对冲基金,资产管理公司和投资银行的分析师。
研究论文上传网站,已有2600万+浏览量、750万+下载、800,000+上传、200万+文章
GeoLite Legacy Downloadable Databases
https://dev.maxmind.com/geoip/geoip2/geolite2/
IP地理定位数据库
Quora's Big Datasets Answer
https://www.quora.com/Where-can-I-find-large-datasets-open-to-the-public
公共开放数据集汇总
Kaggle Datasets
https://www.kaggle.com/datasets
数据文档,拥有20394个数据集
A Deep Catalog Of Human Genetic Variation
https://www.internationalgenome.org/data
国际基因组样本资源
Google Public Data
https://www.google.com/publicdata/directory
谷歌公开数据搜索网站
World Bank Data
世界银行开放数据搜索网站
NYC Taxi Data
http://chriswhong.github.io/nyctaxi/
纽约出租车数据开放平台
Open Data Philly
https://www.opendataphilly.org/
费城开放数据平台、16个数据目录、354个数据集
https://grouplens.org/datasets/
提供9个数据集,关于书籍、电源、wiki数据集
UC Irvine Machine Learning Repository
http://archive.ics.uci.edu/ml/index.php
加州大学欧文机器学习库,提供481个数据集
Research-Quality Data Sets By Hilary Mason
http://web.archive.org/web/20150320022752/https://bitly.com/bundles/hmason/1
公共数据集汇总
National Climatic Data Center - NOAA
美国国家环境信息中心,监测,评估和提供国家气候和历史天气数据和信息