数据集可视化工具FACETS

Facets是谷歌推出的开源数据集可视化工具,包括Overview和Dive两部分,帮助理解和调试ML数据集。Overview提供数据集的高级视图,Dive则支持交互式探索大量多维数据点。Facets支持通过Jupyter notebook或嵌入网页使用,适用于numpy、pandas和tensorflow数据。数据格式要求包括numeric和string类型,Dive提供了丰富的控制选项以深入分析数据。
摘要由CSDN通过智能技术生成

谷歌发布了 Facets,一款开源的可视化工具。它可以帮助你理解、分析和调试 ML 数据集。Facets 包含两个部分——Facets Overview 和 Facets Dive——允许用户从不同的粒度观看数据的全景图,还可以轻易地被用在 Jupyter notebooks 之内,或者嵌入网页之中。除了开放 Facets 源代码,谷歌还创建了演示网站,Github 和网站地址见:
github 地址:https://github.com/pair-code/facets
演示地址:https://pair-code.github.io/facets/

overview

Overview提供一个或多个数据集的高级视图。它生成特征的可视化统计分析,还可以用于比较两个或多个数据集之间的统计信息,可以处理离散值和连续值。

Feature Statistics Protocol Buffer
  • 存储ML系统输入数据的单个特性列的汇总统计信息
  • 顶层原型是DatasetFeatureStatisticsList(DFSL),是一系列的DatasetFeatureStatistics(DFS),每个FDS表示单个数据集的特征统计信息,它包含一系列的FeatureNameStatistics(包含单个数据集中单个特性的统计信息)
  • feature statistics取决于datasets的数据类型(n
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值