KaggleHub 使用指南

秦凡湛Sheila

于 2025-04-16 16:48:15 发布

阅读量827

点赞数 14

本文链接：https://blog.csdn.net/gitblog_00945/article/details/147281065

版权

KaggleHub 使用指南

kagglehub Python library to access Kaggle resources 项目地址: https://gitcode.com/gh_mirrors/ka/kagglehub

1. 项目介绍

KaggleHub 是一个开源库，它为 Python 开发者提供了一种简单的方式来访问 Kaggle 资源，如数据集、模型和笔记本输出。该库与 Kaggle 笔记本环境原生集成，这意味着在 Kaggle 笔记本中运行时，其行为会有所不同。例如，资源会自动附加到 Kaggle 笔记本，并在笔记本编辑器的“输入”面板中显示。

2. 项目快速启动

首先，您需要安装 KaggleHub 库。可以通过 pip 命令进行安装：

pip install kagglehub

接下来，您需要登录 KaggleHub。如果是在 Kaggle 笔记本环境中，KaggleHub 会自动认证。但如果是在本地环境中，您需要手动进行认证。以下是一个认证的例子：

import kagglehub
kagglehub.login()

认证后，您可以下载模型、数据集或笔记本输出。以下是一些基本的操作示例：

下载数据集

from kagglehub import KaggleDatasetAdapter

# 使用 pandas 加载数据集
df = kagglehub.dataset_load(KaggleDatasetAdapter.PANDAS, "dataset-name", "file-name.csv")

下载模型

# 下载模型到本地
kagglehub.model_download('model-handle')

上传模型

handle = '<您的用户名>/<模型>/<框架>/<变体>'
local_model_dir = '本地模型目录路径'
kagglehub.model_upload(handle, local_model_dir, version_notes='更新说明', license_name='Apache 2.0')