谷歌刚刚发布了2500万个免费数据集,快来了解一下

谷歌推出了Dataset Search,可搜索2500万个公开数据集,涵盖地球科学、生物学等领域。这个工具允许用户基于许可证、格式和更新时间筛选结果,但不直接提供数据集访问,而是依赖发布者使用schema.org标准描述元数据。目前,Dataset Search已正式退出测试版,增加了更多功能和过滤选项,适用于各种用户群体,包括学术研究人员、学生和业务分析师。
摘要由CSDN通过智能技术生成

全文共2024字,预计学习时长6分钟

来源:Pexels

 

注意:谷歌的新数据集搜索工具已于2020年1月23日问世。

 

疫情防控阶段,大家的“寒假“越过越长,这么“长”时间的寒假能做些什么呢?

 

 

最近,谷歌发布了免费工具datasetsearch,它可以搜索2500万个公开可用的数据集。

 

搜索工具包括过滤器,可基于许可证(免费或付费)、格式(csv,图像等)和更新时间限制结果。

 

结果还包括对数据集内容的描述以及作者的引用。

 

谷歌的数据集聚合方法不同于其他数据集存储库(如亚马逊的开放数据注册表)。与其他自行管理和托管数据集的存储库不同,谷歌不会直接管理或提供2500万个数据集的访问权限。

 

取而代之的是,谷歌依靠数据集发布者,使用 schema.org的开放标准描述其数据集的元数据。然后,谷歌索引元数据,并使其在发布者之间可搜索。

 

发布者仍需自己托管数据集,因此符合schema.org标准的营利性发布者也将使用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值