用于数据分析/机器学习的公共数据集资源

一. Kaggle datasets

每个数据集都是一个小型社区,大家可以在其中讨论数据、查找一些公共代码或在其中创建自己的项目。里面有大量的实际数据集,这些数据集具有各种形式、大小和不同的格式。您还可以看到与每个数据集关联的“内核”,其中许多不同的数据科学家提供了笔记来分析数据集。有时候你可以在笔记本上找到一些算法来解决这个特定数据集中的预测问题.

二. Amazon Datasets

该数据源包含各种不同领域的许多数据集,如公共交通、生态资源、卫星图像等。你可以通过搜索框快速寻找所需要的数据集,它也有数据集描述和使用的数据集的例子,这是非常有帮助的。

这些数据集存储在Amazon Web Services (AWS)资源中。如果您正在使用AWS进行机器学习实验和开发,这将非常方便,因为这些数据集就存储在AWS网络本地。

三. UCI机器学习库

加州大学信息与计算机科学学院拥有一个包含了100多个数据集的数据库。它根据机器学习问题的类型对数据集进行分类。您很多类型的系统找到训练的数据集。

四. 谷歌的数据集搜索引擎

在2018年谷歌推出一个工具箱服务,可以按名称搜索数据集。他们的目标是统一成千上万个不同的数据集存储库,帮助大家很容易的找到数据集。

五. 微软数据集

2018年7月,微软宣布启动“微软研究院开放数据”计划。

它提供在已发表的研究中使用的数据集,用于促进全球研究社区之间的协作。

六. 公共数据集

它按主题组织的各种数据集,如生物学、经济学、教育学等。这里列出的大多数数据集都是免费的。

七. 政府数据集

为了提高透明度,许多国家向公众共享了各种数据集。下面是部分列表:

· EU Open Data Portal:. 欧洲政府数据集

· New Zealand’s Government Dataset.

· Indian Government Dataset.

· https://www.opendatani.gov.uk/ 北爱尔兰公共数据集

八. 计算机视觉数据集

如果您正在从事图像处理、计算机视觉或深度学习,那么这应该是您需要的实验数据来源。

视觉数据包含少量的大型数据集,可用于构建计算机视觉(CV)模型。您可以通过特定的CV主题来查找特定的数据集,如语义分割、图像标题、图像生成,甚至可以通过解决方案(自动驾驶汽车数据集)来查找数据集。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值