第28章：使用Local dependency轻量级Transformer模型ConvBERT架构及完整源码实现

最新推荐文章于 2024-05-22 11:20:16 发布

StarSpaceNLP667

最新推荐文章于 2024-05-22 11:20:16 发布

阅读量126

点赞数

分类专栏： Transformer NLP StarSpace 文章标签：语言模型架构自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/StarSpaceNLP667/article/details/121551780

版权

Transformer 同时被 3 个专栏收录

112 篇文章 4 订阅

订阅专栏

111 篇文章 0 订阅

订阅专栏

111 篇文章 1 订阅

订阅专栏

1，BERT依赖global self-attention而带来的问题分析

2，BERT不同Layer的computation redundancy分析

3，使用local dependency的数学原理分析

4，local dependency的工程实践

5，convolution head数学原理剖析

6，构建mixed attention block分析

7，ConvBertTokenizer源码解析

8，把TF模型的checkpoints加载入pytorch模型中

9，ConvBertEmbeddings完整源码分析

10，ConvBertPreTrainedModel完整源码分析

11，SeparableConv1D完整源码分析

12，ConvBertAttention完整源码分析

13，ConvBertSelfAttention完整源码分析

14，ConvBertSelfOutput完整源码分析

15，GroupedLinearLayer完整源码分析

16，ConvBertIntermediate完整源码实现分析

17，ConvBertLayer完整源码实现分析

18，ConvBertOutput完整源码实现分析

19，ConvBertEncoder完整源码实现分析

20，ConvBertPredictionHeadTransform完整源码实现分析

21，ConvBertModel完整源码实现分析

22，ConvBertGeneratorPredictions完整源码实现分析

23，ConvBertForMaskedLM完整源码实现分析

24，ConvBertClassificationHead完整源码实现分析

25，ConvBertForSequenceClassification完整源码实现分析

26，ConvBertForMultipleChoice完整源码实现分析

27，ConvBertForTokenClassification完整源码实现分析

28，ConvBertForQuestionAnswering完整源码实现分析

29，ConvBertConfig代码分析

StarSpaceNLP667

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
第28章：使用Local dependency轻量级Transformer模型ConvBERT架构及完整源码实现

1，BERT依赖global self-attention而带来的问题分析2，BERT不同Layer的computation redundancy分析3，使用local dependency的数学原理分析4，local dependency的工程实践5，convolution head数学原理剖析6，构建mixed attention block分析7，ConvBertTokenizer源码解析8，把TF模型的checkpoints加载入pytorch模型中9，ConvB..
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。