transformer-Autoregressive Language Models之GPT-1、2、3解析及GPT源码实现

1,Task-aware的人工智能Language model + Pre-training + Fine-tuning时代

2,Decoder-Only Stack数学原理及架构解析

3,训练材料标注:neutral、contradiction、entailment、multi-label、QA等

4,NLP(Natural Language Understanding):Semantic similarity、document classification、textual entailment等

5,大规模Unsupervised pre-training贝叶斯数学原理及架构剖析

6,Task-specific Supervised fine-tuning的Softmax及Loss详解

7,针对Classification、Entailment、Similarity、Mutiple Choice特定任务的Input数据预处理解析及矩阵纬度变化处理

8,GPT2架构解析:Language Models for unsupervised multitask learners

9,GPT 2把Layer Norm前置的数据原理剖析

10,GPT 2 Self-Attention剖析

11,GPT 2 Training数据流动全生命周期解析

12,GPT 2 Inference数据流动全生命周期解析

13,GPT 3 架构剖析:Language Models are Few-Shot Learners

14,由GPT 3引发的NLP12大规律总结

15,GPT数据预处理源码完整实现及调试

16,GPT的BPE实现源码及调试

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值