- AWS (Amazon Web Server) Public datasets 亚马逊公用数据集 :过去,查找、下载、自定义和分析卫星图像或基因组数据等大型数据集需要几个小时或几天的时间。当数据在 AWS 上公开提供后,任何人都可以分析任意数量的数据,而无需自行下载或存储这些数据。包括:地理空间和环境数据集、基因组和生命科学数据集、机器学习数据集、监管和统计数据。
- BigML : BigML提供一个建立和共享数据集和模型的管理平台,能够利用现有的云计算解决方案是它的优势。BigML只专注于机器学习,提供了一套更广泛的功能,这些功能都集成在一个可用的Web UI上。你可以加载数据集,训练和评估你的模型,并生成新的预测(无论逐一或成批)。
- BioAssay Research Database 生物鉴定研究数据库 : BASD是功能强大的新生物数据库,来自美国国立卫生研究院分子库项目。现在,科学家可以以前所未有的效率来开发和测试假设不同化学探测器对生物学功能的影响。
- Bitly : bit.ly 向用户提供了查看被缩短网址的点击量等的统计。可以使用bitly来统计政府公共网址(如1.usa.gov等)的匿名点击量。
- Canada Open Data 加拿大政府公开的数据 : 有关加拿大政府服务&
数据挖掘-公开数据集的合集
最新推荐文章于 2024-07-06 15:20:11 发布
本文列举了多个提供公开数据集的平台,包括AWS Public Datasets的地理空间、基因组、机器学习数据,BigML的机器学习管理平台,生物鉴定研究数据库BASD,Bitly的链接分析,加拿大开放数据以及美国Data.gov的多元化政府数据。这些资源为科研、分析和机器学习提供了丰富的信息源。
摘要由CSDN通过智能技术生成