huggingface HF_HOME 更换缓存目录

默认情况下,下载数据集并缓存到 ~/.cache/huggingface/dataset.

您可以通过设置HF_HOME环境变量来自定义缓存的文件夹。
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

若配置完环境,发现并没有生效,基本解决思路: 重新打开命名窗口、应用。
若还不生效:那就 重启电脑!

from datasets import load_dataset

raw_datasets = load_dataset("glue", "mrpc")
raw_datasets

在这里插入图片描述
到此默认缓存目录切换成功

### 设置 HF_HOME 环境变量的路径 为了正确设置 `HF_HOME` 环境变量的路径,可以按照以下方法操作: #### 方法一:通过 Shell 配置文件永久设置 可以在用户的 shell 配置文件中添加环境变量定义。对于大多数 Linux 发行版,默认使用的配置文件可能是 `/etc/environment` 或者用户家目录下的 `.bashrc`、`.zshrc` 文件。 以下是具体的操作步骤说明: 1. 打开终端并编辑对应的配置文件。例如,如果使用的是 Bash,则可以通过命令 `nano ~/.bashrc` 编辑该文件。 2. 添加如下内容以设置 `HF_HOME` 路径: ```bash export HF_HOME="/目标/路径" ``` 这里的 `/目标/路径` 是希望 Hugging Face 使用的新缓存路径[^4]。 3. 保存文件后运行以下命令使更改生效: ```bash source ~/.bashrc ``` #### 方法二:临时设置(仅当前会话有效) 如果只需要在一个特定的任务或者脚本执行期间改变此变量而不需要长期修改系统配置的话,可以直接在命令行输入上述导出语句来实现即时效果而不影响其他地方的行为模式。 ```bash export HF_HOME="/新的/缓存/位置/" ``` 注意这种方式只会在当前shell session里起作用;一旦关闭窗口或退出登录就会丢失这些设定值[^5]。 #### 方法三:Jupyter Notebook 中动态调整 当处于 Jupyter notebook 环境下工作时,即使已经全局设置了某些环境参数也可能因为启动方式等原因未能被识别采用。此时可在 Python script 内部手动指定它们的位置信息作为替代方案之一。 ```python import os os.environ['HF_HOME'] = '/data1/example_user/cache' os.environ['HUGGINGFACE_HUB_CACHE'] = '/data1/example_user/cache' os.environ['XDG_CACHE_HOME']='/data1/example_user/cache' ``` 以上代码片段展示了怎样利用 python 的内置模块 os 来重新分配三个不同但相互关联的 cache directories 给 hugging face 库用作存储模型及其他资源之用途。 最后提醒一下,完成任何一种形式上的改动之后都应该验证其实际成果是否符合预期。比如加载数据集测试能否成功读取到新地址中的资料等行为表现正常与否即为良好指示器之一。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

jieshenai

为了遇见更好的文章

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值