Transformer入门-Huggingface的基础04-model学习

Model的简介

一.模型类型

目前基于Transformer的模型主要存在以下三种:
1.仅仅包含Transformer的编码器模型(自编码模型):,使用Encoder,可以从两个方向进行编码,拥有双向的注意力机制,即计算每一个词的特征时都看到完整上下文。常见仅仅存在编码器的预训练模型有:ALBERT,BERT,DistilBERT,RoBERTa等。经常被用于的任务:文本分类,命名实体识别,阅读理解等
2.仅仅存在Transformer的解码器模型:(自回归模型),使用Decoder,拥有单向的注意力机制,即计算每一个词的特征时都只能看到上文,无法看到下文。常见的预训练模型:GPT,GPT-2,GPT-3,Bloom,LLaMA等。经常被用于文本生成中。
3.具有Transformers的编码器-解码器:(序列到序列模型),使用Encoder+Decoder,Encoder部分使用双向的注意力,Decoder部分使用单向注意力。常见的预训练模型为:BART,T5,mBART,GLM等。被用于文本摘要和机器翻译中。

二.Transformers中的Model Head

  1. *model模型本身
  2. *ForCausalLM
    如果你的任务是基于因果语言建模(Causal Language Modeling),你可能会使用像 GPT(Generative Pre-trained Transformer)这样的模型。
  3. *ForMaskedLM
    Hugging Face Transformers 提供了用于掩码语言建模(Masked Language Modeling,MLM)的预训练模型,这些模型通常用于填充缺失的令牌并从上下文中预测缺失的令牌。
  4. *ForSeq2SeqLM
    Hugging Face Transformers 提供了许多用于序列到序列学习(Seq2Seq Learning)任务的预训练模型,这些模型用于翻译、摘要、对话生成等应用。
  5. *ForMultiplechoice
    “ForMultipleChoice” 是 Hugging Face Transformers 库中用于多项选择任务(Multiple Choice Task)的模型或任务处理类之一。Hugging Face Transformers 提供了各种预训练的自然语言处理模型和相关工具,使得在多项选择任务中使用这些模型变得更加方便。
  6. *ForQuestionAnswering
    ForQuestionAnswering 是 Hugging Face Transformers 库中用于问答任务(Question Answering Task)的类。这个类通常用于加载预训练的模型,以便在给定的文本段落中回答特定问题。
  7. *ForSequenceClassification
    ForSequenceClassification 是 Hugging Face Transformers 库中用于序列分类任务的类。这个类通常用于加载预训练的模型,以便在给定的文本序列中执行分类任务。
  8. *ForTokenClassification
    Hugging Face Transformers 库中用于令牌级别分类任务(Token Classification Task)的类。这个类通常用于加载预训练的模型,以便在给定的文本序列中执行对每个令牌进行分类的任务,比如命名实体识别(NER)。

三.总结

随着预训练语言模型的发展,可以说2023年是大模型飞速发展的时代,目前已经出现多种大预言模型,比如LLaMA,LLaMa-2,ChatGPT4等。有空会整理最近一些大模型的论文。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Algorithm_Engineer_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值