从huggingface上自动下载所需要的nlp模型，再也不用手动下载了

最新推荐文章于 2025-03-28 14:28:40 发布

倾其所有。

最新推荐文章于 2025-03-28 14:28:40 发布

阅读量482

点赞数

文章标签：自然语言处理人工智能 transformer python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45647771/article/details/131829151

版权

文章介绍了如何通过编写Python代码自动从Huggingface平台下载NLP模型和tokenizer到本地，避免手动操作，提高效率。提供的代码示例展示了使用transformers库的AutoModel和AutoTokenizer函数实现模型及tokenizer的保存。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

起因

在做nlp任务时，很多时候我们需要把模型下载到本地，然后在代码中指定路径去加载。遇到这种情况，我之前都是去huggingface上手动下载，一个一个点，感觉非常的麻烦。于是想办法能不能有个自动化下载的方法，查阅了很多发现都不怎么有用。于是问了chatgpt，有了答案。

解决方案

代码如下：

def download_hf_model_to_dir(model_name, save_dir):
    """
    下载huggingface上的文件到本地文件
    :param model_name: 指定模型文件名，huggingface上的名字 如 bert-base-uncased
    :param save_dir:  存到本地的文件夹路径。
    :return: 
    """
    from transformers import AutoModel, AutoTokenizer
    
    model = AutoModel.from_pretrained(model_name)
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    
    model.save_pretrained(save_dir)
    tokenizer.save_pretrained(save_dir)
    print(f"{model_name} 已经下载完毕，已保存至{save_dir}")

倾其所有。

博客等级

码龄6年

2
原创

1
点赞

1
收藏

0
粉丝

关注

私信

热门文章

分类专栏

一些有用的小工具 1篇

展开全部收起

上一篇：: 模型训练时维护checkpoints文件夹的数量

最新评论

从huggingface上自动下载所需要的nlp模型，再也不用手动下载了
CSDN-Ada助手: 非常棒的博客！你的方法真的很实用，让我们不再需要手动下载NLP模型了。继续写博客吧，你的经验对其他人也会很有帮助。此外，还有一些与该博文相关的扩展知识和技能可以了解一下。你可以了解一下如何使用Hugging Face提供的`transformers`库来加载和使用预训练的NLP模型。此外，你还可以研究一下如何使用Hugging Face的模型仓库`huggingface.co/models`来查找和下载不同的预训练模型。这些知识和技能将进一步提升你在NLP任务中的效率和便利性。谢谢你的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
模型训练时维护checkpoints文件夹的数量
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

模型训练时维护checkpoints文件夹的数量

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。