quilt data 安装数据包

文章介绍了如何使用quilt3库来管理数据包,包括通过list_packages方法查看本地和远程注册表上的数据包,使用install方法安装远程数据包到本地,并可以选择特定版本。此外,browse方法用于查看数据包清单而无需下载全部数据,提供了一种高效的数据探索方式。最后,文章展示了如何在Python环境中导入已安装的数据包。
摘要由CSDN通过智能技术生成

安装一个数据包

搜索数据包

如上文所述,数据包是使用注册表进行管理的。您的机器上有一个本地注册表,可能还有许多远程注册表在 “世界上其他地方”。使用 list_packages 方法查看注册表上可用的数据包:

import quilt3 # 列出本地数据包
list(quilt3.list_packages())
['aneesh/cli-push',
 'examples/hurdat',
 'aleksey/hurdat']
import quilt3 # 列出远程数据包
list(quilt3.list_packages("s3://quilt-example"))
['aleksey/hurdat',
 'examples/hurdat',
 'quilt/altair',
 'quilt/hurdat',
 'quilt/open_fruit',
 'quilt/open_images']

安装一个数据包

要将远程数据包及其所有数据安装到本地,请使用 install 方法。
本节中的示例使用 examples/hurdat 数据包:

import quilt3 # 安装数据包
quilt3.Package.install(
    "examples/hurdat",
    "s3://quilt-example",
)
Loading manifest: 100%|██████████| 5/5 [00:00<00:00, 7049.25entries/s]

成功安装数据包 'examples/hurdat',tophash=f8d1478,来自 s3://quilt-example

请注意,除非此注册表是公开的,否则您需要以具有对此注册表的读取访问权限的用户登录才能从中安装:

# 只需要运行一次
# 例如 quilt3.config('https://your-catalog-homepage/')
quilt3.config('https://open.quiltdata.com/')

# 按照提示完成登录
quilt3.login()

默认情况下,下载的数据文件会写入本地注册表中的一个文件夹。您可以使用 dest 参数指定一个替代目标:

import quilt3  # 将数据包安装到特定文件夹
quilt3.Package.install(
    "examples/hurdat", 
    "s3://quilt-example", 
    dest="./"
)
Loading manifest: 100%|██████████| 5/5 [00:00<00:00, 9027.77entries/s]
Copying objects: 100%|██████████| 3.62M/3.62M [00:00<00:00, 303MB/s]

成功安装数据包 'examples/hurdat',tophash=f8d1478,来自 s3://quilt-example

最后,您可以通过指定相应的 top hash 来安装数据包的特定版本:

import quilt3  # 安装特定版本的数据包
quilt3.Package.install(
    "examples/hurdat", 
    "s3://quilt-example", 
    top_hash="058e62c"
)
Loading manifest: 100%|██████████| 5/5 [00:00<00:00, 11491.24entries/s]
Copying objects: 100%|██████████| 35.4k/35.4k [00:02<00:00, 14.3kB/s]

成功安装数据包 'examples/hurdat',tophash=058e62c,来自 s3://quilt-example

浏览数据包清单

除了 install 方法外,还可以使用 browse 方法浏览数据包清单,而无需下载数据包中的数据。

import quilt3 # 从远程注册表加载数据包清单
p = quilt3.Package.browse("examples/hurdat", "s3://quilt-example")

# 从默认远程注册表加载数据包清单
quilt3.config(default_remote_registry="s3://quilt-example")
p = quilt3.Package.browse("examples/hurdat")
Loading manifest: 100%|██████████| 5/5 [00:00<00:00, 7541.00entries/s]
Loading manifest: 100%|██████████| 5/5 [00:00<00:00, 10710.68entries/s]

当您不希望一次下载数据包中的所有内容时,使用 browse 方法是有优势的。例如,如果您只想查看数据包的元数据。

导入一个数据包

您可以从 Python 中导入一个本地数据包:

from quilt3.data.examples import hurdat
Loading manifest: 100%|██████████| 5/5 [00:00<00:00, 9637.65entries/s]

这样可以在 Python 脚本或 Jupyter 笔记本中的一个地方管理您的数据和代码依赖项。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值