当使用 BertTokenizer.from_pretrained('bert-base-uncased')
加载预训练的 BERT 模型时,Hugging Face 的 transformers
库会从 Hugging Face Model Hub 下载所需的模型文件和分词器文件(如果它们不在本地缓存中)。
默认情况下,这些文件会被下载到本地的缓存目录中。缓存目录具体位置因您的操作系统和环境不同,但通常是以下路径之一:
默认缓存目录
-
Linux / Unix / macOS:
- 默认路径:
~/.cache/huggingface/transformers
- 其中,
~
代表您的用户主目录。
- 默认路径:
-
Windows:
- 默认路径:
C:\Users\<YourUserName>\.cache\huggingface\transformers
- 默认路径:
自定义缓存路径
如果由于某些原因您需要更改默认的缓存路径,可以通过设置环境变量 TRANSFORMERS_CACHE
来指定新的路径。例如,在命令行中设置:
export TRANSFORMERS_CACHE