主流数据集来源

最新推荐文章于 2024-10-30 11:43:33 发布

Small_handsome

最新推荐文章于 2024-10-30 11:43:33 发布

阅读量2.9k

点赞数 1

文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zsd0819qwq/article/details/105196117

版权

大数据专栏收录该内容

1 篇文章

订阅专栏

1、Kaggle数据集

Kaggle数据集地址

https://www.kaggle.com/datasets

每个数据集都对应于一个小型社区，你可以在其中讨论数据、查找公共代码，或者在其中创建自己的项目。这里包含了大量不同类型、不同结构的数据集内容。同时，还可以在其中获取到与每个数据集关联的资料，其中包含了许多数据科学家们提供的数据集分析笔记等。

2、Amazon数据集

AWS开放数据地址

https://registry.opendata.aws/

这个数据集中包含了不同领域的数据内容，例如：公共交通、生态资源、卫星图像等。同时提供了搜索功能，以帮助用户找到所需的数据集，还有各种数据集的描述信息以及用例，非常易于使用。

数据集存储在Amazon Web Services（AWS）资源中，对于使用AWS构建自己机器学习实验的用户来说，传输速度将非常块。

3、UCI机器学习数据集

UCI数据集地址：

https://archive.ics.uci.edu/ml/datasets.html

这个数据集来自于加州大学信息与计算机科学学院，其中包含了100多个数据集。根据机器学习问题的类型对数据集进行分类，可找到单变量或多变量时间序列数据集，以及分类、回归或推荐系统的数据集。

4、Google数据集搜索引擎

Google数据集搜索引擎

https://toolbox.google.com/datasetsearch

在2018年末，Google推出了数据集搜索服务。这是一个可以按名称搜索数据集的搜索引擎，目标是为数万个不同数据集存储库提供统一搜索入口，非常好用。

5、微软数据集

在2018年7月，微软与外界研究社区一起，发布了微软研究开发数据。

微软数据集地址：

https://msropendata.com/

它包含了云服务器中的数据存储库，致力于促进全球研究社区的协作，并在其中提供了一系列用于已发表研究的数据集内容。

6、Awesome开放数据集收藏列表

Awesom Public Datasets

https://github.com/awesomedata/awesome-public-datasets

本数据集列表中，按主题整理了大量的数据集内容，例如：生物学、经济学、教育等。其中列出的大多数数据集都是免费的，但在使用任何数据集之前，均需检查数据集的许可要求。

7、政府数据集

许多国家均在网络上提供了多种公众可用的政府数据集内容，例如：

欧洲政府数据集

https://data.europa.eu/euodp/data/dataset

美国政府数据集

https://www.data.gov/

新西兰政府数据集

https://catalogue.data.govt.nz/dataset

印度政府数据集

https://data.gov.in/

北爱尔兰公共数据集

https://www.opendatani.gov.uk/

8、VisualData数据集

VisualData数据集

https://www.visualdata.io/

视觉数据包含了一些用于构建计算机视觉模型的优秀数据集，用户可通过某个CV主题查询，例如语义分割、图像标题、图像生成、自动驾驶汽车等内容。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。