https://docs.quiltdata.com/
Quilt是一个自组织的数据中心
Python快速入门,教程
如果你有Python和一个S3存储桶,你就可以使用Quilt创建版本化的数据集。请访问Quilt文档以获取安装说明、快速入门和更多信息。
Quilt的实际应用
open.quiltdata.com是一个基于Quilt的PB级开放数据门户
quiltdata.com包括案例研究、用例、视频以及如何运行私有Quilt实例的说明
《为快速实验设计数据和模型版本管理》展示了如何在实际项目中使用Quilt
Quilt适用于谁?
Quilt适用于数据驱动的团队,并为编码人员(数据科学家、数据工程师、开发人员)和业务用户提供功能。
Quilt是做什么的?
Quilt像代码一样管理数据,使机器学习、生物技术和分析团队能够更快地进行实验,构建更智能的模型,并从错误中恢复。
Quilt如何工作?
Quilt由Python客户端、Web目录、Lambda函数组成,所有这些都是开源的,还有一套由CloudFormation编排的后端服务和Docker容器。
后端服务可在quiltdata.com上以付费许可证的形式使用。
使用案例
规模化共享数据。Quilt将AWS S3封装起来,添加了简单的URL、大文件的Web预览和通过电子邮件地址共享(无需创建IAM角色)。
通过内联文档(Jupyter笔记本、Markdown)和可视化(Vega、Vega Lite)更好地理解数据
通过在ElasticSearch中对对象建立索引,发现相关数据
通过为不适合Git的大型数据和模型提供一个存储位置,并提供对象和数据集的不可变版本(即"Quilt Packages")来对数据进行建模
通过扩大组织内部的数据访问并支持审计版本和内联文档的决策过程记录,进行决策