huggingface transformers包 文档学习笔记(持续更新ing...)

诸神缄默不语-个人CSDN博文目录

本文系huggingface(Hugging Face – The AI community building the future.)旗下Python包transformers 文档(🤗 Transformers)的个人学习笔记合集,各部分的具体内容分别撰写博文,本文以超链接的形式构建目录。
transformers是用于在Python人工智能开发过程中便捷调用预训练模型的Python库。可以应用在文本、视觉、多模态下,但由于作者主要致力于NLP方向,因此仅会关注文本方面的工作,尤其是文本摘要相关的工作。而且transformers可以用多种神经网络框架包作为后端,但是由于作者主要使用PyTorch,因此本文会关注PyTorch方向;此外作者也用过TensorFlow;但是JAX等其他框架完全没用过,所以应该也不会写到相关内容。
此外,由于transformers包更新非常快,因此本文所撰写的内容都随时可能过时。作者只能保证在相应部分的内容被撰写时可用。
本文原本的各部分排列顺序为transformers官方文档各部分排列顺序,但是因为文档整个排版都更新了,所以我就直接按照我的笔记撰写的顺序来写了。笔记撰写的顺序是当时的文档排列顺序,随着原文档顺序修改,可能与当下的文档排列顺序不符。

另:

  1. 本文中所介绍transformers文档中的视频都是YouTube源,因此有一些读者可能没法看。
  2. transformers文档各部分的内容都可以通过 transformers官方的notebooks 进行实战代码训练,其中colab的代码一些读者可能没法上,但是SageMaker Studio的代码是在大陆可以直接加载的。
  3. 本文中较靠后的博文,可能有些内容是以假设读者阅读过此前博文为前提来撰写的。如果您在阅读过程中出现了由于前提知识不足而产生的理解问题,可以给我留下评论,我会写明对应前提知识的对应资料。

正文:

transformers介绍:
网址:https://huggingface.co/docs/transformers/master/en/index
transformers是适用于PyTorchTensorFlowJAX的机器学习包,可用于下载和训练预训练模型。用预训练模型比从0开始训练模型更好(可以减少计算代价和时间、减少碳足迹之类的)。

  1. huggingface.transformers速成笔记:Pipeline推理和AutoClass 对应的原文档网页:
    1. https://huggingface.co/docs/transformers/master/en/quicktour
    2. https://huggingface.co/docs/transformers/master/en/pipeline_tutorial
    3. https://huggingface.co/docs/transformers/master/en/autoclass_tutorial
  2. huggingface.transformers安装教程 对应的原文档网页:https://huggingface.co/docs/transformers/master/en/installation
  3. huggingface.transformers哲学 对应的原文档网页:https://huggingface.co/docs/transformers/master/en/philosophy
  4. huggingface.transformers术语表 对应的原文档网页:https://huggingface.co/docs/transformers/master/en/glossary

    https://huggingface.co/docs/transformers/main/en/preprocessing部分学习笔记与其他部分进行了融合,未单独成文,如有特别对本部分感兴趣的读者可着意参考huggingface.transformers速成笔记:Pipeline推理和AutoClasshuggingface.transformers术语表这两篇笔记。
  5. huggingface.transformers任务简介 对应的原文档网页:https://huggingface.co/docs/transformers/main/en/task_summary
  6. 用huggingface.transformers.AutoModelForSequenceClassification在文本分类任务上微调预训练模型 对应的原文档网页:https://huggingface.co/docs/transformers/main/en/training

    https://huggingface.co/docs/transformers/main/en/run_scripts这篇文档介绍的是如何运行transformers官方GitHub项目中的脚本,主要介绍了不同设置下的参数、代码名字对应的含义、用accelerate加速、在正式运行之前先用小规模数据进行测试的精神、保存checkpoint继续训练
  7. 用huggingface.Accelerate进行分布式训练 对应的原文档网页:https://huggingface.co/docs/transformers/main/en/accelerate
  8. 用huggingface.transformers.AutoModelForTokenClassification实现命名实体识别任务 对应的原文档网页:https://huggingface.co/docs/transformers/tasks/token_classification
  9. 用huggingface.transformers.AutoModelForSeq2SeqLM实现文本生成任务 对应的原文档网页:https://huggingface.co/docs/transformers/tasks/summarization
  • 8
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
### 回答1: huggingface transformers 是一个自然语言处理工具,它提供了各种预训练模型和算法,可以用于文本分类、命名实体识别、机器翻译等任务。它支持多种编程语言,括Python、Java、JavaScript等,可以方便地集成到各种应用中。 ### 回答2: Hugging Face Transformers是一款先进的自然语言处理(NLP)工具,旨在使NLP模型的开发和使用更加容易。它提供了多种预训练的语言模型,如BERT、GPT-2和RoBERTa等,这些模型已在许多NLP任务中取得了卓越的成果。与之前的语言模型相比,这些模型具有更快的训练速度和更高的精度。 除了提供预训练模型之外,Hugging Face Transformers还提供了一组方便的API,可以轻松地对这些模型进行微调或非监督训练。用户可以很容易地获得预测结果,对文本进行编码和解码,并使用其他功能快速重用现有的预训练模型。对于NLP开发人员和数据科学家来说,这意味着他们可以更快地建立高质量的NLP应用程序,而无需大量时间和资源。 Hugging Face Transformers提供了丰富的文档和示例代码,帮助用户更好地理解和使用工具。它还提供了集成到Python环境中的快速部署、计算资源优化和分布式训练的支持。在与其他优秀的开源NLP工具配合使用时,Hugging Face Transformers可以使许多常见的文本分析工作更加容易。 总的来说,Hugging Face Transformers的出现极大地提高了NLP模型的开发效率和准确性,为广大NLP从业者带来了便利和贡献。 ### 回答3: Huggingface transformers是一个基于pytorch和tensorflow的自然语言处理开源工具库,旨在为开发人员和研究者提供高效、易用的语言模型开发和训练框架。该库提供了大量的预训练模型和常用的NLP任务模型,可以帮助开发人员节省训练和调试模型的时间,并提高模型的准确性。 Huggingface transformers的核心是自然语言处理的Transformer模型,BERT、GPT、XLNet、RoBERTa等。这些模型在自然语言处理的各种任务中都非常受欢迎,例如问答、文本分类、情感分析、机器翻译等。同时,Huggingface transformers还提供了一系列的自然语言处理管道,括Tokenization、模型训练、模型推理等。 除了提供现成的预训练模型和任务模型之外,Huggingface transformers还允许用户自定义和训练自己的模型。用户可以使用Huggingface transformers中提供的组件来构建自己的模型,例如transformer层、attention机制等。此外,用户还可以使用预训练模型来进行迁移学习,只需微调模型就能快速获得较好的性能。 总而言之,Huggingface transformers是一个非常实用和方便的自然语言处理工具库,它提供了丰富的预训练模型和任务模型,可以帮助开发人员和研究者快速地训练和测试自然语言处理模型,并取得更好的性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

诸神缄默不语

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值