resnet预训练模型_六种用于文本分类的开源预训练模型

本文介绍了6种先进的文本分类预训练模型,包括XLNet、ERNIE、T5、BPT、NABoE和基于双向LSTM的模型。这些模型在NLP任务上展现出卓越性能,其中XLNet和ERNIE在多个任务中超越了BERT,而T5以单一模型处理多种任务。BPT通过二元分区提高Transformer效率,NABoE利用实体链接提升模型学习,而简单的双向LSTM模型也实现了SOTA性能。
摘要由CSDN通过智能技术生成

介绍

我们正站在语言和机器的交汇处,这个话题我很感兴趣。机器能像莎士比亚一样写作吗?机器能提高我自己的写作能力吗?机器人能解释一句讽刺的话吗?

我肯定你以前问过这些问题。自然语言处理(NLP)也致力于回答这些问题,我必须说,在这个领域已经进行了突破性的研究,促使弥合人类和机器之间的鸿沟。

f30eddc37c99dc286c8e0049014f1386.png

文本分类是自然语言处理的核心思想之一。如果一台机器能够区分名词和动词,或者它能够在客户的评论中检测到客户对产品的满意程度,我们可以将这种理解用于其他高级NLP任务。

这就是我们在文本分类方面看到很多研究的本质。迁移学习的出现可能促进加速研究。我们现在可以使用构建在一个巨大的数据集上的预训练的模型,并进行优化,以在另一个数据集上实现其他任务。

迁移学习和预训练模型有两大优势:

  1. 它降低了每次训练一个新的深度学习模型的成本
  2. 这些数据集符合行业公认的标准,因此预训练模型已经在质量方面得到了审查

你可以理解为什么经过预训练的模特会大受欢迎。我们已经看到像谷歌的BERT和OpenAI的GPT-2这样的模型真的很厉害。在这里中,我将介绍6种最先进的文本分类预训练模型。

我们将介绍的预训练模型:

  • XLNet
  • ERNIE
  • Text-to-Text Transfer Transformer(T5)
  • BPT
  • NABoE
  • Rethinking Complex Neural Network Architectures for Document Classification

预训练模型1:XLNet

我们不能不提及XLNet!

谷歌的最新模型XLNet在文本分类,情感分析,问答,自然语言推理等主要NLP任务上取得了最先进的性能,同时还为英语提供了必要的GLUE基准。它的性能超过了BERT,现在已经巩固了自己作为模型的优势,既可以用于文本分类,又可以用作高级NLP任务。

XLNet背后的核心思想是:

  1. 语言理解的广义自回归预训练
  2. Transformer-XL
f0a73efe280de9a56d68846273124727.png

如果这听起来很复杂,别担心&#

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值