transformer XL

最新推荐文章于 2023-06-22 17:03:35 发布

丁叔叔

最新推荐文章于 2023-06-22 17:03:35 发布

阅读量844

点赞数

分类专栏： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43758551/article/details/99637832

版权

NLP 专栏收录该内容

49 篇文章 0 订阅

订阅专栏

https://new.qq.com/omn/20190130/20190130A0IPM1.html
https://blog.csdn.net/candy134834/article/details/86693757
https://blog.csdn.net/Magical_Bubble/article/details/89060213

模型特点

在 AI-Rfou 等人提出的vanilla Transformer上做了两点创新：

引入循环机制（Recurrence Mechanism）
相对位置编码（Relative Positional Encoding）

优点

在几种不同的数据集（大/小，字符级别/单词级别等）均实现了最先进的语言建模结果。
结合了深度学习的两个重要概念——循环机制和注意力机制，允许模型学习长期依赖性，且可能可以扩展到需要该能力的其他深度学习领域，例如音频分析（如每秒16k样本的语音数据）等。
在inference阶段非常快，比之前最先进的利用Transformer模型进行语言建模的方法快300～1800倍。
有详尽的源码！含TensorFlow和PyTorch版本的，并且有TensorFlow预训练好的模型及各个数据集上详尽的超参数设置。
不足

尚未在具体的NLP任务如情感分析、QA等上应用。
没有给出与其他的基于Transformer的模型，如BERT等，对比有何优势。
在Github源码中提到，目前的sota结果是在TPU大集群上训练得出，对于我等渣机器党就只能玩玩base模式了。

在这里插入图片描述
Transformer-XL

Transformer-XL架构在vanilla Transformer的基础上引入了两点创新：循环机制（Recurrence Mechanism）和相对位置编码（Relative Positional Encoding），以克服vanilla Transformer的缺点。与vanilla Transformer相比，Transformer-XL的另一个优势是它可以被用于单词级和字符级的语言建模。
在这里插入图片描述

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

丁叔叔 CSDN认证博客专家 CSDN认证企业博客

码龄6年

322: 原创

24万+: 周排名

147万+: 总排名

33万+: 访问

: 等级

4318: 积分

59: 粉丝

191: 获赞

25: 评论

803: 收藏

私信

关注

热门文章

分类专栏

产品经理 47篇
问答系统
听书 1篇
neo4j 1篇
测试 5篇
postman 1篇
数据挖掘 2篇
前端 5篇
JAVA
linux 2篇
Git教程 4篇
SPARQL 1篇
protege学习 2篇
PRD撰写
Pytroch 12篇
NLP 49篇
深度学习 34篇
机器学习 46篇
sk-learn 11篇
tf 10篇
爬虫 7篇
爬虫实例 7篇
numpy 3篇
pandas 1篇
matplotlib 6篇
python基础 12篇
opencv 1篇
目标检测 2篇
知识图谱 29篇

最新评论

pyltp
小白顶呱呱: 把语义角色标注结果的解释写清楚了👍
利用tf-idf计算文本相似度
我不是大佬zvj: 在代码里面写绝对路径，你是有点逆天，我复制下来都不好使，还要一个一个改，浪费时间
利用tf-idf计算文本相似度
Domices: 假如所有的文章都不包含这个词，那这个词为什么会被拿来计算呢
matplotlib取消边框
Acowardintheworld: 谢啦就是这个看到好几篇文章，全都是基于子图的
Hmm 和CRF区别
fishguy2022: crf也可以分词啊，词性标注不就是分词吗

大家在看

书生大模型闯关L1G5000：XTuner 微调个人小助手认知 240

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。